Una startup japonesa llamada Sakana ha afirmado que su inteligencia artificial (IA) generó la primera publicación científica revisada por pares. Aunque esta afirmación no es del todo falsa, hay importantes matices a considerar. El debate sobre el papel de la IA en la ciencia se intensifica cada día. Muchos investigadores piensan que la IA aún no está lista para ser un “co-científico”, mientras que otros ven potencial, aunque reconocen que aún es temprano.
Sakana se encuentra en este último grupo. La empresa utilizó un sistema de IA llamado The AI Scientist-v2 para crear un artículo que luego presentó en un taller de ICLR, una conferencia de IA de renombre. Sakana asegura que los organizadores del taller y los líderes de ICLR acordaron trabajar con ellos para realizar un experimento de revisión doble ciego de manuscritos generados por IA.
Sakana colaboró con investigadores de la Universidad de Columbia Británica y la Universidad de Oxford para enviar tres artículos generados por IA al taller mencionado para su revisión por pares. Según Sakana, The AI Scientist-v2 generó los artículos “de principio a fin”, incluyendo hipótesis científicas, experimentos, código experimental, análisis de datos, visualizaciones, texto y títulos.
Robert Lange, un científico investigador y miembro fundador de Sakana, explicó que generaron ideas de investigación proporcionando el resumen y la descripción del taller a la IA, asegurando que los artículos generados fueran relevantes y adecuados para su presentación. Uno de los tres artículos fue aceptado en el taller de ICLR, un trabajo que critica las técnicas de entrenamiento de modelos de IA. Sin embargo, Sakana decidió retirar el artículo antes de su publicación para mantener la transparencia y respetar las convenciones de ICLR.
Lange comentó que el artículo aceptado presenta un nuevo método prometedor para entrenar redes neuronales y muestra que aún existen desafíos empíricos. Sin embargo, el logro no es tan impresionante como parece a simple vista. En un blog, Sakana admite que su IA cometió errores de citación “embarazosos”, como atribuir incorrectamente un método a un artículo de 2016 en lugar de al trabajo original de 1997. Además, el artículo no fue sometido a tanto escrutinio como otras publicaciones revisadas por pares, ya que fue retirado después de la revisión inicial y no recibió una “meta-revisión” adicional.
También es importante mencionar que las tasas de aceptación en talleres de conferencias suelen ser más altas que en la “sesión principal” de la conferencia, un hecho que Sakana menciona abiertamente en su blog. La empresa indicó que ninguno de sus estudios generados por IA cumplió con sus estándares internos para ser presentado en la sesión principal de ICLR.
Matthew Guzdial, investigador de IA y profesor asistente en la Universidad de Alberta, calificó los resultados de Sakana como “un poco engañosos”. Explicó que Sakana eligió los artículos de entre varios generados, lo que implica que usaron juicio humano para seleccionar los que creían que podrían ser aceptados. Esto sugiere que la combinación de humanos e IA puede ser efectiva, pero no que la IA por sí sola pueda generar progreso científico.
Mike Cook, investigador en el King’s College de Londres, cuestionó la rigurosidad de los revisores y del taller. Señaló que nuevos talleres, como este, suelen ser revisados por investigadores más jóvenes y que este taller se centra en resultados negativos y dificultades, lo que podría facilitar que una IA escriba sobre fracasos de manera convincente. Cook añadió que no le sorprende que una IA pueda pasar una revisión por pares, dado que la IA es buena escribiendo textos que suenan humanos.
Sakana, por su parte, no afirma que su IA pueda producir trabajos científicos innovadores o revolucionarios. El objetivo del experimento era “estudiar la calidad de la investigación generada por IA” y resaltar la necesidad urgente de establecer “normas sobre la ciencia generada por IA”. La empresa planteó preguntas difíciles sobre si la ciencia generada por IA debería ser evaluada por sus propios méritos para evitar sesgos en su contra. Sakana se comprometió a seguir dialogando con la comunidad investigadora sobre el estado de esta tecnología para evitar que su único propósito sea pasar revisiones por pares, lo que podría socavar el significado del proceso de revisión científica.


