La ciencia gallega logra que una máquina lea y comprenda «El Quijote» en 20 segundos
CIENCIA
Un equipo de la Universidade da Coruña bate el récord mundial de velocidad y precisión de los analizadores sintácticos utilizados para ayudar a las aplicaciones a comprender el lenguaje humano
07 jun 2019 . Actualizado a las 20:09 h.Las máquinas hablan a los humanos y nosotros podemos comunicarnos con ellas. Es posible desde hace años y cualquiera puede comprobarlo con un asistente de voz instalado en su móvil u ordenador. Pero, ¿se expresan de forma adecuada?, ¿realmente entienden lo que les decimos? La clave del lenguaje radica en el correcto orden y en la relación de las palabras contenidas en una oración para expresar justamente lo que queremos expresar. En definitiva, en la sintaxis, porque no significa lo mismo «la ciudad de los rascacielos» que «los rascacielos de la ciudad». Son diferencias sutiles que aún se le resisten a la inteligencia artificial. Y sí, una máquina suspendería un examen de sintaxis de instituto.
El desafío pasa entonces por conseguir que las máquinas puedan replicar el lenguaje humano. O, lo que es lo mismo, en desarrollar programas analizadores sintácticos precisos y rápidos, un reto en el que los que más lejos han llegado en todo el mundo son los investigadores de la Facultad de Ingeniería Informática de la Universidade da Coruña adscritos al proyecto europeo Fastparse, financiado por el Consejo Europeo de Investigación.También forman parte del centro de investigación CITIC.
El equipo, dirigido por el investigador Starting Grant Carlos Gómez Rodríguez e integrado por Daniel Fernández, Michalina Strzyz y David Vilares, han batido tanto el récord mundial de precisión de un analizador, el que mide su grado de fiabilidad, como el de velocidad de procesamiento. El grupo presentará sus resultados en el congreso norteamericano de la Asociación de Lingüística Computacional, que se celebrará entre mañana domingo y el 7 de junio en Minneapolis.
La precisión de un analizador se mide, de forma estándar, según la proporción de relaciones entre palabras que es capaz de encontrar en una colección de noticias periodísticas en inglés. En este caso, el sistema de los investigadores de la UDC ha conseguido una cifra del 94,43 % de aciertos, por encima del anterior récord del 94,21 % logrado en el 2018 por científicos de las universidades Carnegie Mellon y Tsinghua. Por poner un ejemplo, en la frase María comió una manzana, aunque las hay más complejas, la aplicación tiene que entender que María es el sujeto y manzana el complemento directo. Así se mide el porcentaje de éxito.
Pero cuando se maneja un volumen enorme de datos la velocidad de procesamiento es aún más importante, ya que de lo que se trata es de analizar más texto en menos tiempo. En este caso, los informáticos de la UDC han creado un analizador capaz de procesar a alta precisión más de 700 oraciones por segundo, frente a las 400 alcanzados por los más rápidos que existían anteriormente, desarrollados por la Universidad de Stanford. O, por poner un ejemplo, podría leer, analizar sintácticamente y comprender el texto de El Quijote en tan solo 20 segundos.
Aplicaciones
«La idea de nuestro trabajo es que las máquinas sean capaces de comprender el lenguaje humano de forma adecuada y precisa», explica Carlos Gómez, que lidera el proyecto Fastparse.
La investigación tiene una aplicación directa tanto en la mejora de los asistentes de voz como en la de los buscadores de Internet o en la traducción automática de textos. «Nuestro sistema presenta, además, la ventaja de que funciona para múltiples idiomas», destaca Gómez, quien también destaca que puede tener otras utilidades, desde el análisis de cantidades ingentes de datos en Internet al examen de las tendencias sociales y de la opinión pública a través de su uso de las redes sociales.
«Más importante que el hecho de poder hablar a una máquina lo es que esta nos entienda, que sepa lo que decimos», precisa el investigador, cuyo equipo tendrá la oportunidad de establecer en el congreso norteamericano contactos con empresas interesadas en su revolucionario sistema. Aunque el software que han desarrollado es de acceso libre.