O Corpus Documental do Galego incorpora a linguaxe inclusiva

Montse García Iglesias
Montse garcía SANTIAGO / LA VOZ

CULTURA

A nova versión do Corga foi presentada onte en Santiago
A nova versión do Corga foi presentada onte en Santiago xoán a. soler

A nova versión do Corga recolle xa 40,1 millóns de palabras

17 dic 2019 . Actualizado a las 05:00 h.

Galeg@s, todxs... A nova versión do Corpus Documental do Galego Actual (Corga 3.2), unha ferramenta lingüística desenvolvida polo Centro Ramón Piñeiro para a Investigación en Humanidades (CRPIH) representativa do uso lingüístico do galego actual, incorporou este ano como unha das súas novidades o recoñecemento das formas gráficas innovadoras para a linguaxe inclusiva. Para iso, segundo destacou a directora do proxecto Corga, Marisol López, a relación de etiquetas desta ferramenta incrementouse de xeito notable, pasando dun total de 382 a 453.

«No Corga concorren unhas dúas mil cincocentas formas desta linguaxe inclusiva polo que decidimos crear un novo valor para as categorías de xénero: o xenérico», explicou Eva Domínguez, responsable da coordinación lingüística. Subliñou que a súa presenza supera á segunda persoa singular do pospretérito -cantarías- ou o posesivo para a segunda persoa -teus-. A forma máis abundante recollida neste corpus é a que emprega «@».

Hiperlema

Ademais do recoñecemento das formas gráficas innovadoras, a nova versión do Corga inclúe como novidade a modalidade de hiperlema. A isto hai que engadirlle, segundo destacaron onte durante a presentación da evolución da ferramenta, melloras relacionadas coa visualización dos datos, en forma de expresións coincidentes -de xeito que os resultados iguais se reducen a un- e referidos ao dicionario de frecuencias.

«Podemos combinar os valores para que cada investigador obteña o dicionario de frecuencias que lle interesa», explicou o responsable de informática do proxecto, Mario Barcala. Esta mellora do dicionario de frecuencias foi unha proposta de Guillermo Rojo, investigador colaborador do Ramón Piñeiro -centro dependente da Secretaría Xeral de Política Lingüística- hai pouco máis dun ano. «Falei de facer un dicionario de frecuencias estilo clásico pero de finais do primeiro cuarto do século XXI, é dicir, aproveitando a enorme cantidade de vantaxes que aparecen coa aplicación dos medios informáticos», asegurou.

O Corga está integrado por distintos tipos de textos -xornais, semanarios, revistas, ensaios e texto de ficción- desde o ano 1975 ata a actualidade. A amplitude de documentos que o configuran e os criterios empregados na súa selección permiten considerar este corpus como representativo do uso lingüístico do galego actual. Tamén conta con 25 horas de transcricións ortográficas de programas de radio. Nestes momentos, xa supera os 40,1 millóns de palabras recollidas. O coordinador científico do Centro Ramón Piñeiro, Manuel González, incidiu en que a ferramenta vai evolucionando cada vez máis cara «unha maior amigabilidade e facilidade de uso».

Pola súa banda, o secretario xeral de Política Lingüística, Valentín García, destacou o traballo desenvolvido polo Centro Ramón Piñeiro e engadiu que «a perspectiva que se nos abre é infinita. Aínda queda moito por facer e será un pracer presentar novas versións do Corga».