Opinion
Deepseek e er occitan
Eth 19 de mai de 2023 er Institut d’Estudis Aranesi-Acadèmia aranesa dera lengua occitana, en tot auer en compde que ChatGPT a ua cèrta capacitat entà comunicar-se en occitan estandard (languedocian), se metec en contacte damb era empresa que gestione eth ChatGPT entà demanar-li s’ère possible d’incorporar er occitan aranés en sòn repertòti e es còsti qu’açò aurie, en tot explicar-li es recorsi, molt limitats, que i an e en tot auer en compde que d’autes variantes de d’autes lengües i an estat incorporades.
Era respòsta de ChatGPT arribèc er 11 d’Agost de 2023, as tres mesi, e non ère bric alentadora; comunicaue que dilhèu se poderie arribar a bèth tipe d’acòrd, mès que calie mostrar era disponibilitat economica dera Acadèmia per miei d’assegurar ues quantitats que m’estimi mès de non reproduïr aciu per escandaloses.
Eth més de juriòl de 2024 eth traductor de Google admetie era lengua occitana; ère un pas trascendentau. Era varianta aranesa ei considerada coma lengua inicial, però era lengua d’arribada, ei tostemp era varianta estandard.
Eth passat 20 de gèr eth president deth Govèrn, Pedro Sánchez, anoncièc era metuda a disposicion de toti es ususaris des prumèrs modèls de “Alia”, ua intelligéncia artificial publica en castelhan e en lengües cooficiaus. “Alia” a estat batiada coma eth ChatGPT espanhòl e de bèra manèra ten en compde er occitan. Entà elaborar “Alia” s’a partit deth trabalh que se venguie hènt damb “Aina” eth projècte en qu’interven era Generalitat de Catalonha. Eth cas ei qu’entà elaborar eth traductor Catalan-Galhèc s’a podut establir un còrpus de referéncia de 33 millions de frases, entath catalan-euskera s’an artenhut 10 milions de frases e entath catalan-occitan aranés 400 mil. I a ua mancança de còrpus que de ben segur afectarà eth resultat.
Auem accedit a ua avaloracion deth modèl de traduccion automatica castellan-aranés deth projècte Aina, qu’a estat creat per BSC (Barcelona Supercomputing Center), finançat peth Ministerio para la Transformacion Digital y de la Función Pública. Era avaloracion se hec per miei deth conjunt de dades d’avaluacion coneishut coma Flores+. Veiguem qu’eth nau modèl a ua avaloracion mès positiva e que s’a milhorat eth modèl Apertium que s’emplegaue enquia ara.
A apareishut enes mieis era notícia d’un traductor de Meta, era companhia de Mark Zuckerberg (Facebook, Instagram, WatshApp...), un arnés qu’ajude as persones a traduïr era veu, era parla, entre dus idiòmes: traduccion de votz a votz, e de votz a tèxte entà 101 idiòmes de gessuda e 36 d’arribada, traduccion de tèxte a tèxte entà 96 idiòmes...
E darrèrament, en ues setmanes, eth panorama a cambiat de forma absolutament radical. Era aparicion de DeepSeek chinesa damb un nau modèl, damb milhors prestacions e damb caracteristiques mès populares: còsti de produccion fòrça mès accessibles e còdi dubèrt, se que signifique que fòrça programes internacionaus poderàn accedir ath sòn desvolopament. An cambiat es normes de jòc; ei ua actuacion contra es monopòlis e açò da un respir ar occitan; es monopòlis non considerarien era lengua occitana; non n’an de besonh. Era aparicion de DeepSeek mos apòrte un cambi de paradigma en emplec dera tecnologia; ara ua empresa deth nòste entorn, expèrta en tecnologia digital, qu’age illusion e talent, e volontat cooperativa, damb ua ajuda institucionau fòrça menora ara que li calie hè dus mesi pòt desvolopar ua aplicacion damb emplec der occitan e dera sua varianta aranesa, qu’ère impossible d’imaginar. Tad açò cau qu’es politics damb capacitat de govèrn agen era volontat d’intervier. DeepSeek a daurit es còdis dera IA e quinsevolh, damb coneishements, la pòt emplegar. Ei un creishement geometric. S’an superat aqueres condicions impossibles que hè un an e miei imposaue ChatGPT.
È començat a emplegar DeepSeek entà qüestions relacionades damb era lengua occitana e è podut descorbir que la coneish, però que confon er aranés damb er aragonés; en açò calerà apregondí’i. Cau reflexionar coma promòir era varianta aranesa laguens d’un procés de proteccion generau dera lengua occitana.
E liejut bèth informe sus eth coneishement que DeepSeek a deth catalan e es expectatives son bones; calerà demorar ues setmanes a que se popularise, a que se simplifique eth sòn emplec, e en tornaram a parlar.
E totun volem èster prudents, es estructures monopolistiques, OpenIA, Microsoft, Meta, Google... son aquiu, son fòrtes e era tecnologia de DeepSeek a de someter-se a provès e inspeccions e non cau desbrembar qu’era cultura chinesa non a es contròls e obligacions a qué èm acostumats e qu’era propaganda aué en dia cau meter-la tostemp en desconfiança. Donques se DeepSeek ei coma mos an explicat, milhor entà toti, profitem-ne, e se non au mens auram hèt era reflexion.
Però en qüestion de dies tot pòt auer cambiat; auem podut liéger que bèra auta empresa, tanben chinesa, ja auie superat es propòstes de DeepSeek.
Ara lo qu’ei important ei que i sigam. Es que non i siguen desapareisheràn.
Jornalet es possible gràcias al sosten economic e jornalistic dels legeires e benevòls. Se lo podètz sosténer en venent sòci dels Amics del Jornalet o de l'Associacion ADÒC, o tot simplament en fasent un don, atal contribuiretz a far un mèdia mai independent e de melhora qualitat.
I a pas cap de comentari
Vòstre comentari es a mand d’èsser validat. Per terminar lo procès de validacion, vos cal encara clicar sul ligam qu’anatz recebre per e-mail a l’adreiça qu’avètz indicada.
Escriu un comentari sus aqueste article
Senhala aqueste comentari