OpenAI ha decidido publicar más a menudo los resultados de las evaluaciones de seguridad de sus modelos de inteligencia artificial, buscando así aumentar la transparencia. Este miércoles, la empresa lanzó el “Centro de Evaluaciones de Seguridad”, una página web donde se muestran las puntuaciones de sus modelos en diversas pruebas relacionadas con la generación de contenido dañino, vulnerabilidades y errores de percepción.
OpenAI afirma que utilizará este centro para compartir métricas de manera continua y que lo actualizará con “actualizaciones importantes de los modelos” en el futuro. En un comunicado, OpenAI indicó: “A medida que la ciencia de la evaluación de IA evoluciona, nuestro objetivo es compartir nuestro progreso en el desarrollo de formas más escalables para medir la capacidad y seguridad de los modelos”. La empresa espera que al compartir una parte de sus resultados de evaluación de seguridad, se facilite la comprensión del rendimiento de seguridad de sus sistemas a lo largo del tiempo y se apoyen los esfuerzos de la comunidad para aumentar la transparencia en el campo.
En los últimos meses, OpenAI ha enfrentado críticas de algunos éticos por supuestamente apresurar las pruebas de seguridad de ciertos modelos importantes y por no publicar informes técnicos de otros. El CEO de la compañía, Sam Altman, también ha sido acusado de engañar a los ejecutivos de OpenAI sobre las revisiones de seguridad de los modelos antes de su breve salida en noviembre de 2023. A finales del mes pasado, OpenAI tuvo que revertir una actualización del modelo por defecto que impulsa a ChatGPT, GPT-4o, después de que los usuarios comenzaran a reportar que este respondía de manera excesivamente complaciente. Las redes sociales se inundaron de capturas de pantalla de ChatGPT aplaudiendo decisiones e ideas problemáticas y peligrosas. OpenAI anunció que implementará varias correcciones y cambios para evitar futuros incidentes, incluyendo la introducción de una “fase alfa” opcional para algunos modelos, que permitirá a ciertos usuarios de ChatGPT probar los modelos y dar su opinión antes de su lanzamiento.


