O proxecto Nós para achegar o galego á intelixencia artificial, a piques de presentar prototipos

la voz REDACCIÓN

GALICIA

A directora da Amtega, Mar Pereira, xunto co conselleiro Román Rodríguez e o reitor da USC, Antonio López, este mércores na sinatura do convenio en Santiago
A directora da Amtega, Mar Pereira, xunto co conselleiro Román Rodríguez e o reitor da USC, Antonio López, este mércores na sinatura do convenio en Santiago cedida

A Xunta vén de asinar un segundo convenio de colaboración por valor de 600.000 euros coa USC para avanzar no traballo de campo

18 may 2022 . Actualizado a las 17:59 h.

A lingua galega está cada vez máis próxima da intelixencia artificial. E con isto, dos asistentes de voz (como Siri ou Alexa) e dos tradutores de texto automáticos. Os avances que se están facendo neste eido son froito do Proxecto Nós, que está a desenvolver a Universidade de Santiago a través do seu Centro singular de Investigación en Tecnoloxías Intelixentes (Citius) en colaboración co Instituto da Lingua Galega (ILG). O financiamento vén dado pola Xunta, que onte asinou un segundo convenio por valor de 600.000 euros para avanzar en adiante co traballo de campo.

O acordo formalizouse onte en Santiago nun acto ao que asistiu o conselleiro de Cultura, Educación, FP e Universidades, Román Rodríguez, así como a directora da Axencia para a Modernización Tecnolóxica (Amtega), Mar Pereira. Tamén acudiu o reitor da USC, Antonio López, quen destacou a importancia de incorporar o idioma nas novas tecnoloxías: «Se queremos que as novas xeración falen galego, han de poder facelo tamén con e a través das máquinas».

Coa sinatura do novo convenio de colaboración, os investigadores poderán avanzar co traballo práctico e deseñar prototipos dos recursos tecnolóxicos. Por exemplo, xa se empezarán a desenvolver demostradores e bancos de voz baixo licenzas libres para facilitar que as empresas usen o galego nas súas tecnoloxías. O conselleiro Román Rodríguez sinalou que estas iniciativas non só permitirán que o Proxecto Nós avance, senón que tamén servirán «para implicar toda a sociedade galega nun proxecto de país como este, que nos permitirá chegar a onde o mercado non chega, e que situará o galego nas contornas dixitais».

Pola súa parte, a directora da Amtega lembrou que a intelixencia artificial será a tecnoloxía do futuro e que Galicia xa se está a postular para acoller a sede da futura Axencia española de Supervisión da Intelixencia Artificial.

Normalizar a lingua

Unha das ideas de fondo deste proxecto —para que o Xunta espera investir 15 millóns de euros— é a de normalizar a lingua en tecnoloxías que cada vez cobran maior importancia no día a día dos falantes. Ademais de favorecer os dereitos lingüísticos da cidadanía galega, o proxecto permitirá prestixiar o idioma nun ámbito que terá implicacións no PIB galego e tamén español nun futuro próximo. Con todo, o primeiro acordo de colaboración entre a USC e a Xunta asinouse no 2021: daquela o investimento foi de 150.000 euros e permitiu establecer tres liñas de traballo centradas na conversación oral e escrita con persoas, na calidade da lingua e na xestión da información. Ademais, definíronse oito subproxectos a desenvolver, dos que agora sairán adiante seis.

En concreto, os investigadores centrarán o seu traballo na síntese de voz, no recoñecemento da fala, na xeración automática de textos, nos sistemas de diálogo, na tradución automática e na corrección e avaliación lingüística. Algúns dos prototipos que se vaian elaborando vanse presentar en congresos especializados. Por outra banda, tamén se lle vai dar visibilidade ao traballo realizado na elaboración dos corpus lingüísticos e modelos de lingua.

Os avances que se produzan sumaranse a outros xa conseguidos grazas á colaboración entre o Citius e o Instituto da Lingua Galega. Tempo atrás xa desenvolveron unha tecnoloxía que lle le aos usuarios a páxina web de MeteoGalicia. Isto é, a ferramenta utiliza a intelixencia artificial para informar sobre o clima en lingua galega e ademais emprega as diferentes variantes dialectais en función da zona de busca.