Investigadores gallegos ayudarán al INE a mejorar sus estadísticas

Raúl Romar García
r. romar REDACCIÓN / LA VOZ

SOCIEDAD

Investigadores del Centro de Investigación en TIC
Investigadores del Centro de Investigación en TIC MARCOS MÍGUEZ

Obtienen el mayor de los proyectos del organismo oficial

20 may 2023 . Actualizado a las 05:00 h.

Incorporar nuevas variables aportadas por fuentes alternativas o complementarias para ofrecer un retrato más fiel del área que se pretende analizar; homogeneizar series que de por sí son complejas por sus picos temporales; extraer con una mayor eficacia datos de cuestionarios de texto que se responden a mano... En definitiva, mejorar la calidad de las estadísticas oficiales de todo tipo de sectores y hacerlo con un coste razonable. Es lo que pretende llevar a cabo el Instituto Nacional de Estadística (INE) y para ello se valdrá en gran medida de un equipo formado por 26 científicos del Centro de Investigación en TIC (Citic) de la Universidade da Coruña (UDC).

El grupo, liderado por Ricardo Cao, ha sido el gran beneficiario de la convocatoria de proyectos realizada por el organismo oficial. No era una oferta abierta, sino que estaba dirigida a ofrecer una solución a 13 de los desafíos que planteaban para perfeccionar la estadística oficial. Siete de estas líneas serán abordadas por el equipo gallego, el ganador del proyecto más cuantioso de los cuatro que se concedieron. Recibirá una financiación de 650.000 euros del millón de euros en el que estaba presupuestado el programa.

«O INE ten un sistema de captación de datos de moita calidade a partir das súas enquisas, pero o que persigue é melloralos con novas achegas e sen que lle supoña un custo alto», explica Ricardo Cao. «Sentímonos moi honrados —añade— porque o noso proxecto foi o mellor valorado e o que, con diferenza, recibirá un maior financiamento, o que tamén é para nós unha gran responsabilidade».

La ejecución de la propuesta del Citic se llevará a cabo en contacto estrecho con el INE, porque «queren comprobar que as nosas achegas solucionan os seus problemas». Algunas de las actuaciones también se ejecutarán en colaboración con otros de los equipos seleccionados. La convocatoria oficial reconoció, además, las aportaciones de las universidades Miguel Hernández, de Elche; Politécnica de Madrid, y la de Granada.

El grupo gallego está formado por 19 investigadores especializados en estadística, inteligencia artificial y bases de datos, a los que se sumarán otros científicos que se contratarán con cargo al programa, aunque también se sumarán a la iniciativa investigadores del Instituto Galego de Estadística y de la Universidad de Ginebra.

Dentro de las siete áreas de actuación del equipo gallego, una de ellas es la codificación de respuestas abiertas en encuestas poblaciones. En estos casos, los usuarios escriben a mano, y en sus respuestas introducen datos, por lo que de lo que se trata es de recuperarlos para incorporarlos a la estadística.

Otra área en la que trabajarán es en la de las series económicas de larga duración en el tiempo, como las del paro, el PIB o el IPC, que están sometidas a importantes fluctuaciones temporales. De lo que se trata es de ofrecer una estadística homogeneizada.

Otra de las líneas de investigación será la utilización de información pública en la web para determinar características de empresas relativas a la innovación o a la sociedad de la información. El objetivo es el desarrollo de métodos de aprendizaje automático (machine learning) que permitan recoger información disponible en diferentes webs públicas. Lo que se pretende es incorporar estos valores para ofrecer un retrato más fiel.

El uso de información de pagos con tarjetas bancarias para repartir el gasto de los turistas por comunidades autónomas será otra de las actuaciones. «A información das estadías turísticas faise coas enquisas de entrada e saída, pero é incompleta, porque pode aloxarse nunha comunidade e pasar días noutras, polo que o uso das tarxetas axuda a obter unha maior información», apunta Cao.

También se perfeccionará el cálculo de imputaciones en índices de cifra de negocio de la industria mediante técnicas de machine learning.