CAPÇALERA PAIS INVISIBLE

Opinion

Traductor de Google

Jusèp Loís Sans Socasau

Jusèp Loís Sans Socasau

Jusèp Loís Sans Socasau ei èx-president der Institut d'Estudis Aranesi-Acadèmia Aranesa dera Lengua Occitana (IEA-AALO)

Mai d’informacions

Des de hè quauqui dies eth traductor de Google admet era lengua occitana. Ua grana hita!  Ara a 243 lengües que se pòden traduïr des ues as autes. Ei un des auanci tecnics mès importants entara preservacion dera lengua nòsta.  Ara ei possible de traduïr des der occitan e entar occitan lengües coma eth croata, eth maltés, eth tamil, er euskera, eth wólof, eth vietnamita… lengües des que jamès auem entenut a parlar coma eth kiga (Uganda, 1’6 milions), o eth mizo (India, 500 mil)... Eth reconeishement e era operativitat der occitan a passat a un estadi superior.

Però auem dues qüestions: quina varianta e quina qualitat de lengua a introduït Google e qué passe damb era varianta aranesa der occitan?

Entà avalorar era varianta der occitan distinguim entre era lengua de gessuda e era d’arribada. Coma lengua de gessuda, eth traductor de Google, compren e permet er emplec de diuèrses variantes. S’entratz un tèxte ena varianta aranesa, eth traductor l’enten perfectament e podetz traduïr a quinsevolh des autes 242 lengues. Incredible!, der aranés ath tibetan, per méter un exemple, e era qualitat ei era madeisha que se traduïm deth castelhan ath tibetan. Rebrembi qu’en 2012 sigui testimòni e intervenguí en ua captacion importanta de tèxtes en occitan-aranés per part d’ua empresa vincolada a Google e aquerò me ramplic dera illusion de pensar que non tardaríem en veir ua aplicación damb era nòsta varianta. E certament ara, l’auem coma lengua d’entrada. Se seguim trabalhant, e promoiguent, l’auram tanben coma lengua d’arribada.

Coma lengua resultat, Google emplegue ua varianta de basa lenguadociana, pr’amor qu’ei era varianta mès emplegada ena actualitat, a mès d’èster era mès centrau ena distribucion geografica e aquera que d’ua forma mès generau ei acceptada pera major part des lingüistes coma referéncia entà totes es demès. A auut grana importància era Wikipedia en occitan lenguadocian qu’ena actualitat compde damb lèu 90.000 articles e pròp de 50.000 contributors des qu’ua centea son fòrça actius. Google emplegue es tecniques mès actuaus, coneishudes coma de traduccion automatica neuronal, que substituïssen es tecniques antigues de base estadistica o basades en exemples. Eth sistèma seguirà trabalhant, ath delà d’ara, e de forma automatica anarà corregint es errors. Era qualitat dera lengua ei fòrça bona; complís basicament es critèris der estandard que definís era Acadèmia aranesa dera lengua occitana. Vam ben!

E, auem entrat ena corsa der aprofitament de d’autes foncions de Google Translate, que s’apliquen en d’autes lengües: traduccion de votz,  traduccion manuscrita, transcripcion… I a, per part de Google, tot un trabalh d’estructuracion lingüistica: an es tèxtes, Wikipedia entre d’auti, però tanben an era consulta e trabalh de professionaus hèta de forma discrèta, però lo mès complèta possible. Es contractes as professionaus, as entenuts, arriben des des lòcs mès remòts dera planeta: des de Russia, Filipines, Sudafrica… Es que les contacten an boni coneishements d’occitan. Ei era globalizacion.

E mos tòque rebrembar es traductors automatics ar/der occitan qu’existissen ena actualitat e qu’an significat ua grana contribucion enquia ara tot e que segurament quedaràn desplaças per aguest de Google. Eth prumèr siguec eth traductor catalan-occitan estandard, castelhan-occitan estandard possat pera Generalitat de Catalonha (e peth Conselh Generau d’Aran) e pera Universitat d’Alacant en 2008 (hè 16 ans), basat en ua plataforma de còdi dubèrt, estructurat per Apertium, que tanben hec eth traductor ara varianta aranesa. Hè un an e miei  eth traductor de francés-occitan deth Congrès permanent dera lenga occitana se somèc ad aguestes aportacions en tot qu’auferís, a mès der occitan de basa lenguadociana, eth de basa gascona. D’autes empreses e estructures an hèt d’autes propòstes basades en aqueth prumèr traductor, o an aportat milhores e alternatives.

E era varianta aranesa, ena gessuda? Tà quan? Coma qu’era nòsta petitesa non da entà poder auer un volum important de tèxtes, o sufisent, ei facil de pensar que mos calerà seguir demorant. Non cau pensar que per hèt de que ja s’a penjat era gessuda ena version occitana estandard (de lengua basa lenguadociana), era aranesa a de quedar desplaçada. Era varianta occitan-aranés ei era mès importanta de Catalonha e tanben der Estat e Google ja a dat mòstres de poder publicar era aplicación entà variantes dialectaus diuèrses: a penjat tres variacions de chinés, dues de panyabi, dues de portugués (deth Brasil e de Portugal), dues de kord, dues de pèrsa… Google Translate ja compren er aranés, e la compren ben. Ara cau que s’i exprèsse.  Peth moment mos calerà emplegar es traductors deth catalan e deth castelhan ara varianta occitan-aranés que ja existissen e qu’era Generalitat de Catalonha e er Estat Espanhòl, damb collaboracion dera Universitat d’Alacant e diuèrses empreses estan milhorant. Mos cònste que ja i trabalhen e qu’en brèu gaudiram d’aguestes aplicacions.

Jornalet es possible gràcias al sosten economic e jornalistic dels legeires e benevòls. Se lo podètz sosténer en venent sòci dels Amics del Jornalet o de l'Associacion ADÒC, o tot simplament en fasent un don, atal contribuiretz a far un mèdia mai independent e de melhora qualitat.

Comentaris

Joan Francés Blanc Estrasborg
3.

Es ua messorga díser que la wikipèdia e seré en occitan lengadocian. La causida deu dialècte es liura, la sola exigéncia es la coeréncia intèrna a un article. Era màger des articles sus era val d'Aran es en aranés. Sufeish d'anar véser.

"hita" n'es pas un espanholisme. Es pro estenut dens tot lo maine gascon.

  • 4
  • 0
Franc Bardòu
2.

"Però auem dues qüestions: quina varianta e quina qualitat de lengua a introduït Google e qué passe damb era varianta aranesa der occitan?" La fòrma d'occitan imaginari que prepausa Google non es ni l'occitan estandard (lo de l'Academia Occitan) ni la modalitat estandard de l'occitan que ne prepausa l'AALO, ni lo lengadocian etnografic de cap d'endreit precís tanpauc. L'an tirat coma un conilh d'un capèl de magician.

  • 3
  • 1
Pèir
1.

*hita (calc del catanyol/spanglish "fita", deth castelhan Hito, anglés Milestone). Hita que solament vòu díder Bòla, en francés Borne)

En gascon qu'es HÈTA (catalan "feta")

#espanholisme

  • 0
  • 5

Escriu un comentari sus aqueste article