Tocmai am terminat de urmarit webcast-ul celor de la Amazon despre traducerea (translatarea) automata. Traducerea automata creaza posibilitatea reala de a conversa in timp real cu oricine de pe acest Pamant, indiferent de ce limbi stiu eu si de ce limbi vorbeste el.

Sa zicem ca vizitez China: “Unde gasesc ceva de mancare?” 
Translatorul imi raspunde “我在哪里可以找到食物?“. 
Eu arat traducerea unui localnic. 
El imi raspunde “在这条街的尽头“, adica “La capatul strazii”. 
Eu:“谢谢”(spus Xièxiè), “Multumesc”.

[ Ca toate aplicatiile cool, translatarea automata a prins aripi abia dupa ce Department of Defense american (prin DARPA) a alocat fonduri generoase pentru construirea de translatoare automate eficiente, motivarea lor fiind implicarea armatei americane cam peste tot in lume. ]  

Google translate din romana in maghiara

Folosesc Google translate de multa vreme, dar doar ca sa traduc din engleza intr-o alta limba. Nu am incercat niciodata pornind din romaneste. Mi-am zis, ia sa incerc translatarea automata din romaneste in ungureste. Am facut cateva incercari, mai ales fraze pe care le-am auzit recent frecvent la TV sau le-am citit in presa:

1) “Iohannis castiga alegerile detasat” a fost tradus automat in “Johannis megnyeri a második választást” (aproape, dar nu chiar).

2) “Dancila este proasta” -> “A táncos hülye” (complet gresit. Tin sa precizez ca nu este opinia mea, am preluat doar ce am auzit la TV)

3) “Pierd vremea pe Facebook” -> “Hiányzik a Facebook” (cam pe dos, nu-i asa?)

4) “Ponta este un mincinos” -> “Ponta hazug” (asta a fost tradusa corect)

5) “Nastase are multe oua” -> “A Nastase sok tojást tartalmaz” (chiar asa o fi?)

6) “Politica este porcarie” -> “A politika sz…r” (scuze, Google translate n-are cei sapte ani de-acasa)

7) “Dancila este mai tare ca Barna” -> “A tánc erősebb, mint Barna” (poate da, poate nu)

8) “Iohannis le stie pe toate” -> “Iohannis ismeri őket” (depinde de cine este “toate”)

9) “Smecherul de Basescu nu se duce odata” -> “Basescu törte egyszer sem” (aici cred ca au incercat serviciile sa traduca, pentru ca rezultatul n-are nici un sens)

10) “Bravo translatorule, esti mai prost ca mine” -> “Jó fordító, te hülye vagy, mint én” (oops, ce spun eu si ce intelege el. Totusi, s-ar putea sa aiba dreptate de data asta.)

Concluzia?

De ce nu este traducerea automata din romana in maghiara mai buna?

Calitatea traducerii automate din romana in maghiara mi se pare surprinzator de mediocra. Proasta. Asta in ciuda faptului ca Romania are in Ardeal cateva milioane de bilingvi.

Programele de traducere automata (precum Google translate) folosesc software, ce utilizeaza un proces de antrenare (training), pentru a invata cum sa produca translatarile. Calitatea traducerilor este cu atat mai buna cu cat volumul si diversitatea frazelor bilingve folosite in antrenarea software-ului sunt mai complete si mai multe. Antrenarea este slaba atunci cand ai date insuficiente pentru antrenare.

Cele mai bune programe de traducere automata sunt din engleza in franceza, si viceversa. Oare de ce? Pentru ca vecinul nostru de la nord, Canada, este o tara bilingva. Si prin lege, toate documentele din Parlamentul canadian sunt bilingve. Astfel, exista un volum masiv de documente in engleza si franceza, iar aceste documente au putut fi folosite la antrenarea translatorului automat.

Prin comparatie, calitatea mediocra a traducatorului automat roman – maghiar (sau maghiar – roman) sugereaza ca exista un volum redus de documente bilingve, care au putut fi folosite pentru antrenare. Asta in ciuda populatiei bilingve din Ardeal. Surprinzator si nu. Ce sugereaza situatia asta este interesul foarte redus pentru crearea si folosirea simultan a ambelor limbi in viata de zi cu zi.

A fi sau nu bilingv (sau trilingv sau …)

Fiecare are parerea lui despre a fi sau nu bilingv, eu mi-o spun acum pe a mea.

Eu cred ca intr-o lume fara nationalism orbesc, traducatoarele automate roman – maghiar si respective maghiar roman ar “manca jar”, ar zbarnai de cate documente bilingve exista pentru ca ele sa fie folosite in training. Si de ce sa nu supralicitez? – De fapt nici nu ar fi nevoie de translatoare automate, pentru ca a fi bilingv (sau trilingv sau cvadrilingv …) este normal.

Statul New York unde traim noi are in jur de 3.6 milioane de vorbitori de limba spaniola. Cam 6.6% din populatia statului. Foarte aproape de cei 6.5% de maghiari din Romania, sau 19.2% din Ardeal. Este drept, SUA nu are o limba oficiala, precum este limba romana in Romania. Totusi, copiii statului New York invata spaniola pana la sfarsitul liceului, cand trebuie sa treaca un examen de limba straina (de-obicei spaniola) pentru a absolvi.

Da – stiu, copiii din Ardeal invata engleza sau germana drept limbi straine, pentru ca ambele sunt mult mai utile in afara tarii de cat este maghiara. Doar ca copiii new-yorkezi nu invata spaniola pentru ca au nevoie de ea in afara SUA: marea lor majoritate nu vor merge niciodata nici in Spania, nici in Argentina, nici in Guatemala. Vor merge foarte probabil in concediu in Mexic, dar vor sta in resort-uri unde toate serviciile sunt in engleza. Tinerii new-yorkezi insa invata spaniola pentru ca este foarte utila in interior, adica in Statele Unite. Si asta nu pentru ca populatia Latino nu ar vorbi engleza … Explicatia este ca este normal sa inveti limba celorlalti, cand traiesti impreuna cu ei.

Am vizitat in 2014 o universitate din statul Louisiana. Prorectorul universitatii ne-a spus ca in prima jumatate a secolului XX a existat in stat o politica agresiva de a elimina dialectul Cajun (un dialect local al francezei) si de a-i invata pe copii doar engleza. Louisiana a fost cumparata in 1803 de la Franta (Louisiana purchase), si cu asta SUA a dobandit o populatie vorbitoare de franceza. Dupa ce aproape a reusit sa elimine Cajun, lumea si-a dat seama ca asta inseamna o pierdere culturala de neinlocuit pentru Louisiana. Asa ca acum se cheltuie bani seriosi in scoli pentru a reinvia dialectul Cajun.  

Situatia demografica de aici (ma refer la statul New York) mi se pare extrem de asemanatoare cu cea din Ardeal. Cu o deosebire ca nimanui in tara nu-i trece prin cap ca invatandu-i pe copii in scoli despre limbile si cultura minoritatilor, intaresti de fapt societatea si civismul, reduci suspiciunile si neincrederea.

Ce este de facut?

Habar n-am. Nu-mi place sa dau solutii. Nu sunt nici lider politic, nici lider civic, nici formator de opinii, nici clarvazator, nici nimic. De fiecare data cand in trecut am prezis o solutie, lucrurile s-au intamplat pe dos. Asa ca ma abtin.

Am vrut doar sa aduc in atentia lumii o situatie care mie mi se pare absurda, situatie care printre multe consecinte rele, o are si pe aceea ca … Google translate din romana in maghiara functioneaza surprinzator de slab.          

Si cu asta am ajuns la sfarsitul gandului meu: sa fim cu totii sanatosi si mai intelegatori unul cu altul. O saptamana placuta tuturor si ne auzim in curand.

Publicaţia Știrile Transilvaniei se bazează pe contribuţia prin postare directă a lucrărilor multor autori talentaţi din toate părţile lumii. Responsabilitatea asupra conţinutului articolelor aparţine în întregime autorilor, punctele de vedere sau opiniile expuse nefiind sub responsabilitatea administrației publicației. Răspunderea juridică asupra conținutului articolelor, inclusiv copyright-ul, aparține exclusiv autorului. Sistemul de publicare fiind automat, administrația publicației nu este implicată în promovarea vreunui autor sau a scrierilor acestuia și nici în asumarea răspunderii editoriale sau de conținut. Dacă apar probleme de natură rasială, etnică sau copyright, vă rugăm să ni le semnalaţi pentru remediere prin ștergere la adresa de corespondenţă mai jos menţionată. Articolele care vor fi contestate justificat prin e-mail vor fi retrase de pe site, mergându-se până la eliminarea completă a autorului care a încălcat principiile de copyright sau de non-discriminare.