Siri e Alexa aprenderán a falar galego

Cinthya Martínez Lorenzo
cinthya martínez SANTIAGO / LA VOZ

CULTURA

O reitor da USC, Antonio López, na presentación de Nós, con Román Rodríguez e Mar Pereira.
O reitor da USC, Antonio López, na presentación de Nós, con Román Rodríguez e Mar Pereira. Santi Alvite | USC

O proxecto Nós permitirá interactuar na lingua de Rosalía co mundo dixital

27 oct 2021 . Actualizado a las 05:00 h.

Moraima, a nena que se fixo popular nas redes sociais por intentar comunicarse con Siri en galego -tentativa á que a asistenta virtual respondía que non entendía-, poderá volver a facelo, e desta vez con éxito, dentro dun tempo. A Xunta e a Universidade de Santiago, a través do Instituto de Lingua Galega (ILG) e o Centro Singular de Investigación en Tecnoloxías Intelixentes (CiTIUS), poñen en marcha o proxecto Nós, que permitirá o uso natural da lingua galega nas interaccións dixitais entre as persoas e os diversos dispositivos tecnolóxicos dispoñibles no mercado.

Así, búscase construír un sistema de ferramentas que serán imprescindibles para que o galego poida ter presenza nos asistentes de voz, servizos de teleasistencia avanzada, subtítulos automáticos de contidos audiovisuais, apoio ao diagnóstico médico ou tramitación administrativa a través de asistentes virtuais. «Trátase de que o galego se poida desenvolver no mundo dixital ao igual que o fan grandes linguas como o inglés, o francés ou o castelán», explica Antonio López, reitor da Universidade de Santiago, no acto de presentación do acordo.

Esta fase inicial permitirá que o ILG e o CiTIUS empecen a traballar na catalogación dos recursos dispoñibles para levar a cabo un deseño das diferentes partes que compoñen o proxecto Nós. Esta farase en dúas grandes áreas: unha de procesamento de texto e outra de voz. Posteriormente, definiranse os equipos de traballo e as estratexias de coordinación entre eles, así como as metodoloxías de seguimento e avaliación de calidade dos recursos e ferramentas resultantes.

A planificación do proxecto conta cunha inversión de 150.000 euros, mais o Goberno galego prevé acabar destinando 15,5 millóns a esta iniciativa grazas ao amparo dos fondos europeos Next Generation, converténdose no maior investimento directo na promoción da lingua. «É un proxecto estratéxico para Galicia no que o galego como lingua cooficial vai estar en igualdade cos desenvolvementos tecnolóxicos presentes e futuros», anuncia Román Rodríguez, conselleiro de Cultura, Educación e Universidade. Engade que o proxecto poderá desenvolverse dunha maneira «máis rápida» e «máis forte» co apoio do capital europeo, pero se este resulta rexeitado intentarán «sacalo adiante igual aínda que mude a velocidade».

Nese senso, a directora da Axencia de Modernización Tecnolóxica de Galicia (Amtega), Mar Pereira, salientou que se trata «dun proxecto de futuro» que se enmarca na Estratexia Galega de Intelixencia Artificial. Unha serie de accións que pretenden impulsar tanto a cooperación público-privada como cos diferentes centros de coñecemento. 

Como ensinarán galego a Siri?

O director do CiTIUS, Senén Barro, explica que unha das peculiaridades das tecnoloxías lingüísticas é que son «altamente consumidoras de recursos computacionais». É dicir, requiren de máquinas moi potentes que teñen que procesar proporcións moi grandes de datos, xa sexa de texto ou audio. Poñendo o exemplo do asistente de voz Siri, esta terá que «aprender» sobre eses elementos de información. «E eses procesos de aprendizaxe son extremadamente custosos tanto en tempo como en capital humano», asegura Barro.

Por esa razón, unha gran porcentaxe dos fondos que se invistan en Nós irán destinados aos recursos humanos, claves no proceso de recompilación de corpus e bases de datos de voz. «Teremos que recoller moitos datos que non son en modo texto, facer demostradores tecnolóxicos e casos de uso», apunta o director do CiTIUS. «Aínda que existen elementos básicos que poden ser usados para calquera idioma, as especificidades da lingua en algúns ámbitos profesionais requiren adestramentos específicos», engadiu referíndose ás ferramentas previstas sobre administración pública e medicina. Así, para a posible interlocución para diagnósticos médicos, a asistenta virtual terá que recoñecer palabras e estruturas que se utilizan nese tipo de situacións concretas.

Senén Barro recoñece que «o proxecto é unha aposta ambiciosa, pero non é das máis grandes». Destaca que compañías americanas como Google ou Amazon «invisten millóns e millóns de dólares cada ano para manterse na vangarda das tecnoloxías lingüísticas, neste caso, do inglés».