¿El último examen de la Humanidad?

ESCUELA

Un grupo de expertos ha presentado el cuestionario definitivo para desafiar a la inteligencia artificial

26 may 2026 . Actualizado a las 18:22 h.

En un mundo en el que la inteligencia artificial está cada vez más presente y cobra más protagonismo —más capacidades, más tareas y funciones— en todos los ámbitos, un grupo de 1.000 hombres y mujeres seleccionados entre los mayores expertos y especialistas en las principales disciplinas y campos del saber humano (matemáticas, humanidades, ciencias naturales, ingeniería...) han aunado esfuerzos y conocimientos para crear el bautizado como el último examen de la humanidad: el cuestionario definitivo con el que desafiar a la IA e identificar sus debilidades.

Podría ser perfectamente la sinopsis de una película de (no tanta) ciencia ficción. Pero es la realidad —ligeramente adornada, todo hay que decirlo— para que suene a blockbuster.

Porque, en efecto, el último examen de la humanidad es una realidad: un extenso cuestionario de hasta 2.500 preguntas que abarca todo tipo de materias y especialidades. La fortaleza de los modelos de IA reside en su capacidad para identificar patrones ocultos en grandes bancos de datos e información. Así pues, cada una de las cuestiones del examen ha sido planteada expresamente para que no pueda ser respondida a partir de la información disponible, sino que requiera algo más: esa capacidad de razonamiento que entendemos como inteligencia o, mejor aún, como pensamiento creativo, y que consiste justamente en eso, en pensar de manera distinta o divergente, en salirse de los patrones establecidos.

Y los resultados alcanzados son esperanzadores en el sentido de que ninguno de los principales modelos de IA a examen, desde ChatGPT hasta Gemini, ha sido capaz de aprobarlo.

Fiabilidad de ChatGPT

Pero ¿de verdad era necesario semejante esfuerzo colectivo, poner toda la carne (el conocimiento humano) en el asador? Cuesta creerlo cuando a finales del año pasado se publicó otro estudio análogo en el que dos educadores quisieron poner a prueba la fiabilidad de ChatGPT y, por ende, si para los estudiantes es una buena idea fiarse a pies juntillas de sus respuestas. Se sometió al popular modelo a una prueba bastante más sencilla: resolver el clásico problema geométrico de doblar el área de un cuadrado, descrito por Platón hace 2.400 años: «Dado un cuadrado inicial de lado L, ¿cuánto mide el lado de un cuadrado con el doble de superficie?» .

Y para su sorpresa encontraron que ChatGPT se ofuscaba dando respuestas equivocadas a pesar de que el enigma y su resolución están suficientemente documentados en internet. La clave para entender por qué ChatGPT no ofrecía la solución correcta es saber que los modelos de inteligencia artificial están entrenados con textos y están optimizados para generar respuestas basadas en patrones de palabras, pero no con diagramas, que es la clave para resolver fácilmente el problema. Y también una pista para que demuestres que eres bastante más inteligente que ChatGPT resolviendo con facilidad el enigma platónico.

De vuelta al último examen de la humanidad y teniendo en cuenta todo lo anterior, ¿te atreves a sumarte al grupo de expertos y plantear también tú una pregunta que creas que la inteligencia artificial no va a poder responder? Una vez formulada, pon a prueba tus conjeturas pidiéndole a cualquiera de los chatbots que la responda.

Miguel Barral es divulgador científico.