OpenAI ha actualizado su Marco de Preparación, que es la guía interna que utiliza para decidir si los modelos de inteligencia artificial son seguros y qué medidas de protección son necesarias durante su desarrollo y lanzamiento. La compañía ha indicado que podría “ajustar” sus requisitos si un laboratorio rival lanza un sistema de “alto riesgo” sin las mismas medidas de seguridad. Este cambio responde a la creciente presión competitiva en los desarrolladores de IA para lanzar modelos rápidamente.
OpenAI ha sido criticada por bajar sus estándares de seguridad para acelerar los lanzamientos y por no entregar informes a tiempo sobre sus pruebas de seguridad. Sin embargo, la empresa asegura que no tomará estos ajustes a la ligera y que mantendrá sus medidas de protección en un nivel más seguro. En un blog publicado el martes, OpenAI afirmó: “Si otro desarrollador de IA lanza un sistema de alto riesgo sin medidas de seguridad comparables, podríamos ajustar nuestros requisitos. No obstante, primero confirmaremos rigurosamente que el panorama de riesgos ha cambiado, reconoceremos públicamente que estamos haciendo un ajuste, evaluaremos que este ajuste no aumente significativamente el riesgo de daño severo y mantendremos las medidas de protección en un nivel más seguro”.
El Marco de Preparación actualizado también indica que OpenAI se está apoyando más en evaluaciones automatizadas para acelerar el desarrollo de productos. Aunque no ha abandonado por completo las pruebas realizadas por humanos, ha creado “un conjunto creciente de evaluaciones automatizadas” que pueden “mantener el ritmo de un lanzamiento más rápido de modelos”. Según el Financial Times, OpenAI dio a los evaluadores menos de una semana para realizar chequeos de seguridad para un modelo importante que se lanzará pronto, un plazo más corto en comparación con lanzamientos anteriores. Fuentes del medio también afirmaron que muchas de las pruebas de seguridad de OpenAI ahora se realizan en versiones anteriores de los modelos, antes de que sean lanzados al público.
Otros cambios en el marco de OpenAI se refieren a cómo la empresa clasifica los modelos según su riesgo, incluyendo aquellos que pueden ocultar sus capacidades, evadir medidas de seguridad, prevenir su propia desconexión e incluso auto-replicarse. OpenAI ahora se enfocará en si los modelos cumplen con uno de dos umbrales: “alta” capacidad o “crítica” capacidad. La primera se refiere a un modelo que podría “amplificar caminos existentes hacia un daño severo”, mientras que la segunda incluye modelos que “introducen nuevos caminos sin precedentes hacia un daño severo”.
OpenAI ha declarado que los sistemas que alcancen una alta capacidad deben tener medidas de seguridad que minimicen adecuadamente el riesgo de daño severo antes de ser desplegados. Los sistemas que alcancen una capacidad crítica también requieren medidas de seguridad que minimicen adecuadamente los riesgos durante su desarrollo. Estos cambios son los primeros que OpenAI ha realizado en su Marco de Preparación desde 2023.


