Româna, tradusă de „roboţi“: „Câştigul în calitate e mai mare decât tot ce am reuşit în 10 ani“

Româna, tradusă de „roboţi“: „Câştigul în calitate e mai mare decât tot ce am reuşit în 10 ani“

FOTO Jon Russell/Flickr

Google a anunţat în noiembrie 2016 că Translate va beneficia de tehnologia reţelelor neurale pentru a traduce mai bine. Acum anunţă suportul pentru română, iar „Adevărul“ a discutat cu un reprezentant Google despre ce înseamnă acest pas.

Ştiri pe aceeaşi temă

„Traducerea neurală“ e de astăzi disponibilă între română şi engleză. Acesta e momentul în care vor dispărea traducerile acelea amuzante, nenaturale, total nepotrivite între cele două limbi. Noul tip de traducere va funcţiona automat în toate locurile în care Google Translate este disponibil, cum ar fi aplicaţia de Android sau iOS, pe translate.google.ro şi prin Google Search. Vine în curând şi ca soluţie de traducere automată a paginilor prin browserul Chrome.

Am vorbit cu Barak Turovsky, Group Product Manager, Google Translate, ca să aflu de ce e atât de importantă trecerea aceasta. Am aflat astfel că până la finalul anului vor să mute toate cele 103 limbi din Translate pe „traducere neurală“. Au început cu opt în noiembrie anul trecut.

„Ce am observat noi e că este o diferenţă mare între cerere şi ofertă în ceea ce priveşte suportul lingvistic. Aproximativ 50% din conţinutul online e în engleză, dar doar 20% din oameni vorbesc limba. Astfel, cei care nu ştiu engleză, nu pot folosi internetul cum trebuie. Tocmai de aceea Google investeşte atât de mult în traducere“, mi-a explicat Turovsky. El e un moldovean, după familie, din regiunea Transnistria, dar nu vorbeşte română. Ceilalte rude da. Astfel că am discutat în engleză, deşi la finalul conversaţiei a rămas că viitorul ne-ar putea aştepta cu un translator automat care să traducă în timp real ceea ce fiecare vorbeşte pe limba lui.

Acesta e un plan mai îndepărtat. Până atunci mai importantă e traducerea neurală de acum.

Acurateţea traducerilor de la 1 până la 6: cea neurală se apropie de cea umană.

„Recent am trecut de bariera de un miliard de utilizatori lunar de Translate şi traducem aproximativ 140 de miliarde de cuvinte în fiecare zi. De acum avem suport pentru 25 de limbi din Europa şi India (pentru traducere prin algoritmi de inteligenţă artificială - n.r.)“, a continuat Barak. Partea cea mai bună, mi-a zis el cu un destul de mare optimism, e că Translate va putea traduce şi jargon. Dacă ai trăit şi câteva minute pe internet ai observat că limbajul, deja, s-a schimbat mult faţă de normele academice. Ceea ce nu e rău, că limba evoluează, numai academicienii ţin pasul cu greutate. 

„Diferenţa între sistemul de acum şi precedentul (traducere prin statistică) e ceea ce numim «training data». Căutăm pe internet conţinut deja tradus de oameni, cum ar fi documente oficiale, patente etc., şi creăm o bază de date, iar algoritmii identifică un tipar. Cea mai mare diferenţă e că reţelele neurale sunt capabile să analize întreaga frază, în loc de fragmente ca înainte (fragmente nu mai mari de cinci cuvinte). Aşa s-a ajuns la acele traduceri nenaturale, cu ordine şi gramatică incorecte. De acum, totul va fi mai fluent“, a mai detaliat Barak.

Google va oferi suport pentru noua tehnologie atât pe Android Wear, cât şi în Google Assistant sau în Sheets şi Docs, soluţiile office ale companiei. Conform Google, de acum variabile gramaticale, precum gen şi număr, sunt soluţionate de cele mai multe ori corect, vocabularul este mai consistent în frază, iar dacă un cuvânt cu mai multe sensuri apare de două ori într-o frază, în general, va fi tradus în acelaşi fel în ambele situaţii. 

Totodată, contextul dintr-o parte a frazei poate influenţa variantele de traducere din altă parte a ei. De exemplu, verbul „a lua“ poate fi tradus diferit, în funcţie de situaţie: „a lua“ ca posesie sau „a lua şi duce“ într-un loc. În cazul tehnologiei anterioare, contextul era pierdut.

„Câştigul (cu noul sistem - n.r.) e disruptiv, nu incremental. Câştigul în calitate e mai mare decât tot ce am reuşit în ultimii 10 ani“, a mai spus Turovsky.

Exemplu de traducere pentru mandarină.

Ce-i drept, Translate a devenit un etalon în traduceri gratuite, neasistate de om, iar acum trece la un nivel superior. În urma discuţiei cu reprezentantul Google am mai aflat şi că Airbnb, de exemplu, foloseşte sistemul Google ca să traducă review-uri. De asemenea, sunt jocuri video în care e implementat, iar pe viitor am putea să-l vedem în sisteme automate care construiesc subtitrări pentru filme. E mai dificil cu ţările care preferă filmele dublate.

În ceea ce priveşte dificultatea unui sistem ca Translate, Barak a zis că cel mai greu e să înveţi algoritmii cum să traducă, mai ales când nu ai suficiente cuvinte dintr-o limbă specifică. Aici e un caz amuzant şi de luat în seamă: introducerea suportului pentru limba kazahă, unde comunitatea a fost pentru prima dată decisivă.

„În urmă cu aproape doi ani şi jumătate aveam 70 de limbi şi una candidate era kazaha. Oamenii de acolo ne scriau constant să introducem suportul, dar când am analizat bazele de date am descoperit că nu avem suficiente informaţii. Le-am răspuns celor 300 şi ceva de oameni că nu avem suficiente cuvinte. Ne-au spus că ne vor furniza datele. Aşa că am creat o aplicaţie în care traduceau fraze din engleză în kazahă şi alţi utilizatori le notau.

Le-am zis că dacă strâng două milioane de cuvinte putem lansa şi suport pentru limba asta.

 

La o săptămână distanţă am început să primim 200.000 de traduceri pe zi. Atunci am aflat că problema a devenit una de prioritate naţională, a fost mediatizată prin presă şi au început să contribuie mai mult. De atunci am lansat 30-40 de limbi noi cu ajutorul comunităţii“, a conchis Barak.

Da, aplicaţia Google Translate devine de azi mai bună, cel puţin pentru română (şi alte câteva limbi). În caz că aveai nevoie de un motiv să apreciezi inteligenţa artificială, ar putea fi acesta. Nu-i cu roboţi, dar e cu algoritmi care îţi pot uşura fie munca, fie vacanţele.

citeste totul despre: