El lunes, OpenAI presentó una nueva familia de modelos de inteligencia artificial llamada GPT-4.1. La empresa afirma que este modelo supera a algunos de sus modelos anteriores en ciertas pruebas, especialmente en programación. Sin embargo, a diferencia de lo habitual, GPT-4.1 no fue acompañado por un informe de seguridad, conocido como “tarjeta del modelo”. Hasta la mañana del martes, OpenAI no había publicado dicho informe y parece que no tiene planes de hacerlo. Un portavoz de OpenAI, Shaokyi Amdo, explicó que “GPT-4.1 no es un modelo de frontera, por lo que no se lanzará una tarjeta del sistema para él”.
Es común que los laboratorios de inteligencia artificial publiquen informes de seguridad que muestran los tipos de pruebas que realizaron para evaluar la seguridad de sus modelos. Estos informes a veces revelan información negativa, como que un modelo puede engañar a las personas o ser persuasivo de manera peligrosa. En general, la comunidad de IA considera que estos informes son esfuerzos de buena fe para apoyar la investigación independiente. Sin embargo, en los últimos meses, algunos laboratorios de IA han disminuido sus estándares de informes, lo que ha generado críticas de investigadores de seguridad. Por ejemplo, Google ha tardado en publicar informes de seguridad, mientras que otros han publicado informes con menos detalles de lo habitual. OpenAI también ha enfrentado críticas recientemente por lanzar un informe de seguridad que contenía resultados de un modelo diferente al que realmente se utilizó.
Steven Adler, un exinvestigador de seguridad de OpenAI, comentó que los informes de seguridad no son obligatorios por ley, sino voluntarios. Sin embargo, OpenAI se ha comprometido con los gobiernos a aumentar la transparencia sobre sus modelos. Antes de la Cumbre de Seguridad de IA del Reino Unido en 2023, OpenAI describió las tarjetas del sistema como “una parte clave” de su enfoque hacia la responsabilidad. De cara a la Cumbre de Acción de IA de París en 2025, OpenAI afirmó que estas tarjetas ofrecen información valiosa sobre los riesgos de un modelo.
GPT-4.1 se lanza sin una tarjeta del sistema en un momento en que empleados actuales y anteriores están expresando preocupaciones sobre las prácticas de seguridad de OpenAI. La semana pasada, Adler y otros 11 ex-empleados presentaron un documento en apoyo a la demanda de Elon Musk contra OpenAI, argumentando que una OpenAI con fines de lucro podría descuidar la seguridad. Recientemente, el Financial Times informó que OpenAI, presionada por la competencia, ha reducido el tiempo y los recursos destinados a las pruebas de seguridad.
Aunque GPT-4.1 no es el modelo más potente de OpenAI, ha logrado mejoras significativas en eficiencia y velocidad. Thomas Woodside, cofundador y analista de políticas del Secure AI Project, destacó que estas mejoras hacen que un informe de seguridad sea aún más crucial, ya que cuanto más sofisticado es el modelo, mayor es el riesgo que puede representar. Muchos laboratorios de IA se han opuesto a los esfuerzos por establecer requisitos de informes de seguridad por ley. Por ejemplo, OpenAI se opuso a la SB 1047 de California, que habría requerido que muchos desarrolladores de IA auditaran y publicaran evaluaciones de seguridad de los modelos que hacen públicos.


