12/08/2020 05:00 h

El mundillo del software está revolucionado con GPT-3, la tercera iteración del modelo de lenguaje de OpenAI que, básicamente, es un sistema de Inteligencia Artificial que genera un texto calculando la continuación «más probable» a partir de otro.

Pero lo que ha hecho que a más de uno le estalle la cabeza es que no resuelve tareas simples del tipo completa la frase 'cuando hace mucho calor me baño en' sino que, a partir de un simple enunciado, GPT-3 es capaz de generar código funcional sin que haya sido entrenado explícitamente en programación.

Twitter se inundó de hype: los programadores tenían los días contados -¡el propio software acabaría con sus trabajos!- pero, como veterano que ha visto cómo intentaban jubilar a la profesión en varias ocasiones, no presté mucha atención al ruido. Todavía recuerdo cómo, a finales de los 90, muchos creían que las herramientas CASE nos iban a mandar a todos a casa, hasta que comprobaron que el código que generaba el Rational Rose de turno era un truñaco que se tardaba más en arreglar que en hacer desde cero.

Sin embargo, hace apenas una semana recibí un inquietante correo de Andrés Torrubia, una de las personas que más saben en este país de Inteligencia Artificial:

El resultado era bastante impresionante, sobre todo teniendo en cuenta que, hace apenas un par de años, Andrés entrenó a una red neuronal para «automatizarme», proporcionándole todas las Bonilistas escritas hasta la fecha, y el resultado fue bastante robótico (ver a partir del minuto 26). Nada que ver con el texto impecablemente escrito que GPT-3 había armado a partir de un puñado de párrafos.

¿De verdad habían construido una Inteligencia Artificial capaz no ya de programar sino, también, de escribir textos como este sin que fuéramos capaces de distinguir su trabajo del llevado a cabo por un humano?

La realidad, en este caso, no es tan espectacular como el hype generado alrededor. Y, aunque GPT-3 nos deje vislumbrar el enorme potencial de la Inteligencia Artificial, este aún no es capaz de programar como tal ni tampoco de crear, como nos explica el propio Andrés en su estupendo podcast.

Para entender qué es exactamente GPT-3 y su alcance hay que conocer primero algunos conceptos básicos:

Inteligencia Artificial es una rama de la informática que estudia el diseño y construcción de máquinas capaces de replicar el razonamiento humano y, por tanto, de resolver tareas para las que no se las ha programado previamente. Aunque hay tantas definiciones como controversia al respecto.

es una rama de la informática que estudia el diseño y construcción de máquinas capaces de replicar el razonamiento humano y, por tanto, de resolver tareas para las que no se las ha programado previamente. Aunque hay tantas definiciones como controversia al respecto. La Inteligencia Artificial débil (que es lo que hemos logrado hasta ahora con GPT-3, Siri o la mierda de filtro de SPAM de Gmail) puede simular ese razonamiento humano para un tipo específico de problemas (jugar al ajedrez), pero no es capaz de simular la inteligencia humana en general.

(que es lo que hemos logrado hasta ahora con GPT-3, Siri o la mierda de filtro de SPAM de Gmail) puede simular ese razonamiento humano para un tipo específico de problemas (jugar al ajedrez), pero no es capaz de simular la inteligencia humana en general. La Inteligencia Artificial fuerte o general podría resolver cualquier tarea intelectual como un ser humano. Hasta ahora, solo es ciencia-ficción (T-800, HAL 9000, Wall-E o Número 5). Hasta ahora, claro.

podría resolver cualquier tarea intelectual como un ser humano. Hasta ahora, solo es ciencia-ficción (T-800, HAL 9000, Wall-E o Número 5). Hasta ahora, claro. Machine Learning o aprendizaje automático es una técnica de Inteligencia Artificial con la que se entrena a las máquinas para reconocer patrones: defino las características de un gato (morfología, colores, proporciones), le paso al modelo un montón de fotos de gatos hasta que, llegado un momento dado, este será capaz de buscar y encontrar esas características y determinar la probabilidad de que en una imagen haya un maldito gato.

o aprendizaje automático es una técnica de Inteligencia Artificial con la que se entrena a las máquinas para reconocer patrones: defino las características de un gato (morfología, colores, proporciones), le paso al modelo un montón de fotos de gatos hasta que, llegado un momento dado, este será capaz de buscar y encontrar esas características y determinar la probabilidad de que en una imagen haya un maldito gato. Deep Learning o aprendizaje profundo es una subtécnica de Machine Learning cuya principal diferencia con la misma es que no hay que indicarle al modelo lo que debe buscar. Si le pasamos suficientes (muchas) fotos de gatos será capaz de encontrar por sí mismo los patrones que los identifican.

o aprendizaje profundo es una subtécnica de Machine Learning cuya principal diferencia con la misma es que no hay que indicarle al modelo lo que debe buscar. Si le pasamos suficientes (muchas) fotos de gatos será capaz de encontrar por sí mismo los patrones que los identifican. A su vez, esos modelos pueden tener un aprendizaje supervisado o no. El aprendizaje supervisado es aquel que se basa en datos etiquetados (te digo que esta foto es de un gato y esta no) mientas que el no supervisado trabaja con datos no etiquetados en donde intenta identificar diferentes patrones.

GPT-3 es un modelo de Deep Learning que ha utilizado una enorme cantidad de datos no supervisados. En concreto, 700 GB de datos disponibles públicamente en Internet procesados por miles de GPUs.

Es esa nueva escala tanto de potencia de cálculo como de la información con la que ha sido entrenado la mayor diferencia de GPT-3 respecto a su antecesor, ya que gestiona con 175.000 millones de parámetros por los «apenas» 1.500 millones con los que contaba GPT-2, pero el sistema sigue sin saber si los textos que crea tienen algún sentido y menos aún si el código que genera funciona correctamente, sólo la probabilidad de que sea «adecuado» en base a los parámetros de entrada proporcionados.

Así que puede que algún día un sistema de software te quite el trabajo o lo transforme radicalmente, pero ese no será GPT-3. Lo que sí puede lograr es hacer comprender a la Comunidad Técnica hasta qué punto ha avanzado la Inteligencia Artificial en los últimos años. «Simplemente» escalando los modelos -con más datos y más capacidad de cómputo- estos han empezado a hacer cosas que no esperábamos.

Esto ya no va de identificar fotos de gatetes o jugar al ajedrez -en realidad, nunca lo fue- sino de un sistema informático capaz de resolver problemas generales, como cualquier ser humano. Lo que nos ha mostrado GPT-3 es que esa Inteligencia Artificial general -una tecnología que transformará radicalmente la Sociedad en la que vivimos- no es ciencia-ficción sino algo que será real en apenas 30 o 40 años y, nos guste o no, conoceremos la mayoría de nosotros.

Y, aunque nuestro Gobierno sigue en las batuecas, es ahora cuando nos estamos jugando quién y cómo gestionará ese inmenso poder. OpenAI se constituyó como una organización sin ánimo de lucro para asegurarse de que la Inteligencia Artificial se usaba para el bien de la humanidad, no para dominarla. Sin embargo, en 2019 admitió una inversión de 1.000 millones de dólares de Microsoft que les obliga a obtener beneficios de sus investigaciones.

GPT-3 no es un modelo open source sino que ha sido publicado como una API que será explotada comercialmente, según la propia OpenAI para «controlar el mal uso de la tecnología» entre otras cosas, pero ¿de verdad queremos dejar en manos privadas y sin ningún tipo de control la decisión de qué está bien y qué está mal?

Who watches the watchmen?

