Un fin de semana, el ingeniero de software y fundador de startups Neel Somani puso a prueba las capacidades matemáticas del nuevo modelo de OpenAI, GPT 5.2, y se llevó una sorpresa: tras dejar pensando a ChatGPT durante 15 minutos sobre un problema complejo, obtuvo una demostración completa que, al ser verificada y formalizada con la herramienta Harmonic, resultó correcta.
El modelo no solo encadenó razonamientos avanzados utilizando resultados como la fórmula de Legendre, el postulado de Bertrand o el teorema de la Estrella de David, sino que también localizó una publicación de 2013 en Math Overflow, donde el matemático de Harvard Noam Elkies resolvía un problema similar. A partir de ahí, ChatGPT construyó una demostración distinta y más completa de una versión de un problema planteado por el legendario Paul Erdős, cuyos más de mil problemas abiertos se han convertido en un banco de pruebas para la IA.
La irrupción de modelos como GPT 5.2 y herramientas especializadas ha acelerado el uso de IA en matemáticas: desde asistentes de formalización como Aristotle, de Harmonic, hasta sistemas de revisión de literatura. Desde Navidad, en la web que recopila los problemas de Erdős se han pasado 15 problemas de “abierto” a “resuelto”, y en 11 de ellos se reconoce explícitamente la contribución de modelos de IA.
El prestigioso matemático Terence Tao documenta en GitHub al menos ocho problemas de Erdős donde la IA ha hecho progresos autónomos significativos y otros seis donde ha ayudado a encontrar y aprovechar trabajos previos. Tao sostiene que la capacidad de escalar de estos sistemas los hace especialmente útiles para atacar el “largo cola” de problemas poco conocidos, muchos de ellos con soluciones relativamente directas, y prevé que cada vez más de estos retos sean resueltos solo por IA.
En paralelo, gana fuerza la formalización de las pruebas, un proceso tradicionalmente laborioso que ahora se ve agilizado por herramientas como el asistente de demostraciones Lean y por modelos como Aristotle, capaces de automatizar parte del trabajo. Más allá del número de problemas resueltos, el fundador de Harmonic, Tudor Achim, subraya que lo relevante es que matemáticos y profesores de alto nivel estén empezando a usar estas herramientas, lo que considera una señal fuerte de que la IA se está integrando de forma real y seria en la práctica de la investigación matemática.


