Machinevertaling is zich al tientallen jaren aan het ontwikkelen. Iedere dag wordt het minder science fiction en meer realiteit. De nuances in een taal begrijpen is moeilijk, zelfs voor mensen. Het is dan ook vrij logisch dat machinevertaling zich nog niet optimaal heeft kunnen ontwikkelen.
VROEGE GESCHIEDENIS
Ontwikkelaars dromen al van computers die taal snel begrijpen en vertalen sinds de eerste daarvoor potentiële krachtige machines. Een van de belangrijkste resultaten van het creëren en verbeteren van vertaaltechnologie, is dat het de computerwereld openstelt voor méér dan wiskundige en logische functies. Namelijk voor een complexe relatie tussen woorden en betekenissen.
De vroege geschiedenis van machinevertaling begon rond de jaren ’50. Warren Weaver van de Rockefeller Foundation startte met het combineren van het machinale kraken van codes en natuurlijke taalverwerking. Hij was daarmee al in 1949 een pionier op het gebied van computervertaling. Zijn voorstellen kunnen gevonden worden in zijn “Memorandum over Vertaling”.
Fascinerend genoeg, duurde het niet lang voordat er vraag kwam naar computervertalingsprojecten. Het onderzoeksteam dat het Georgetown-IBM experiment gestart was, demonstreerde in 1954 een machine die 250 woorden kon vertalen van het Russisch naar het Engels.
HUIDIGE ONTWIKKELINGEN
Men dacht dat machinevertaling snel zou uitgroeien tot dé oplossing voor een heleboel problemen omtrent communicatiebarrières. Veel vertalers begonnen te vrezen voor hun baan. Toch werd die snelle vooruitgang niet gerealiseerd, omdat computers de subtiele nuances in taal niet konden oppikken.
Ongeacht de taal hebben woorden vaak meerdere betekenissen. Het menselijk brein is simpelweg beter uitgerust voor het complexe raamwerk van begrip en syntaxis dan computers. In 1964 rapporteerde de Amerikaanse Automatic Language Processing Advisory Committee (ALPAC) dat machinevertaling de inspanning en middelen om dit te kunnen realiseren niet waard was.
1970-1990
Niet in alle landen werd hier hetzelfde over gedacht. In de jaren ‘70, ontwikkelde Canada het METEO-systeem. Dit systeem vertaalde weerrapporten van het Engels naar het Frans. Het was een simpel programma dat in staat was om 80.000 woorden per dag te vertalen. Het was succesvol genoeg om tot in de jaren 2000 gebruikt te worden, voordat er een systeemupdate nodig was.
Het Franse Textiel Instituut gebruikte machinevertaling om samenvattingen vanuit het Frans naar het Engels, Duits en Spaans te vertalen. Rond dezelfde tijd gebruikte Xerox zijn eigen systeem om technische handleidingen te vertalen. Beiden werden al in de jaren ’70 effectief ingezet. Machinevertaling stond echter nog maar in de kinderschoenen bij het vertalen van technische documenten.
In de jaren ’80, zetten mensen zich in om vertaalgeheugentechnologie te ontwikkelen. Dat was het begin van het overbruggen van de uitdagingen in het genuanceerde verbale communicatieproces. Toch bleven systemen dezelfde problemen ondervinden in het omzetten van tekst in een andere taal zonder betekenisverlies.
2000
Dankzij de ontwikkeling van het internet en alle kansen die dit bood, won Franz-Josef Och een snelheidswedstrijd machinevertaling in 2003. Hij werd later het hoofd van de vertaalafdeling van Google. In 2012 verkondigde Google dat Google Translate genoeg tekst verwerkte om in één dag een miljoen boeken mee te vullen.
Japan loopt ook voorop in de revolutie van machinevertaling door het ontwikkelen van spraak-tot-spraak vertalingen voor mobiele telefoons in de talen Engels, Japans en Chinees. Dit is het resultaat van een investering in tijd en geld om een computersysteem te ontwikkelen dat uitgaat van een neurologisch netwerk. En niet van op geheugen gebaseerde functies.
Google informeerde het publiek in 2016 dat de implementatie van de neurologische netwerk benadering de duidelijkheid in Google Translate verbeterd heeft, waarbij veel vreemde taalfouten geëlimineerd zijn. Google noemde dit het Google Neural Machine Translation (NMT) systeem. Het systeem begon taalparen te vertalen die het niet geleerd had. De programmeurs leerden het systeem content vertalen van het Engels naar het Portugees en van het Engels naar het Spaans. Hierdoor kon het uiteindelijk ook tekst van het Portugees naar het Spaans vertalen. En dat terwijl het dit talenpaar niet expliciet aangeleerd had gekregen.
TOEKOMSTIGE PROJECTEN
Ooit werd geloofd dat de tijd eindelijk gekomen was dat machinevertaling menselijk werk zou kunnen overnemen. In 2017 hielden de Sejong Cyber Universiteit en de International Interpretation and Translation Association van Korea een wedstrijd tussen vier mensen en vooraanstaande machinevertaal systemen. De machines vertaalden de tekst sneller dan de mensen, zonder twijfel. Maar ze konden nog steeds niet winnen van het menselijk brein op het vlak van nuancering en nauwkeurigheid van de vertalingen.
Mensen dromen als sinds voor de jaren ’50 van de snelheid en het gemak dat betrouwbare machinevertaling belooft. Het aangename idee van een gedeelde manier om wereldwijd te kunnen communiceren, heeft nog steeds een lange weg te gaan. Een computer ontwikkelen die net als een mens denkt, zal de wereld meer mogelijkheden bieden dan alleen communicatie. De technologie gaat veel verder dan machines die goed kunnen rekenen – het brengt de wereld ieder jaar steeds dichter bij elkaar. Maar voor nu is het beter om een menselijke vertaler in te zetten voor teksten die belangrijk zijn.