A finales de marzo, OpenAI anunció que lanzará su primer modelo de lenguaje “abierto” desde GPT-2 este año. Ahora, están saliendo a la luz detalles sobre este modelo gracias a las sesiones de la empresa con la comunidad de desarrolladores de inteligencia artificial. Fuentes indican que Aidan Clark, vicepresidente de investigación de OpenAI, lidera el desarrollo de este modelo, que se encuentra en sus primeras etapas. OpenAI planea lanzarlo a principios del verano y busca que este modelo, que se asemeja a los modelos de la serie o de OpenAI, sea el mejor en comparación con otros modelos de razonamiento abiertos.
OpenAI está considerando una licencia muy permisiva para el modelo, con pocas restricciones de uso o comerciales. Modelos abiertos como Llama y Gemma de Google han sido criticados por algunos en la comunidad por imponer requisitos complicados, algo que OpenAI parece querer evitar. La empresa enfrenta una creciente presión de competidores como el laboratorio de inteligencia artificial chino DeepSeek, que ha adoptado un enfoque abierto para lanzar sus modelos. A diferencia de OpenAI, estos competidores “abiertos” permiten que la comunidad de IA experimente y, en algunos casos, comercialice sus modelos, lo que ha demostrado ser una estrategia exitosa para algunos.
Meta, que ha invertido mucho en su familia de modelos de IA abiertos Llama, anunció a principios de marzo que Llama ha superado los 1,000 millones de descargas. Mientras tanto, DeepSeek ha acumulado rápidamente una gran base de usuarios en todo el mundo y ha atraído la atención de inversores locales. Fuentes mencionan que OpenAI planea que su modelo abierto, que funcionará con “texto de entrada y texto de salida”, se ejecute en hardware de consumo de alta gama y posiblemente permita a los desarrolladores activar y desactivar su “razonamiento”, similar a los modelos de razonamiento que han lanzado recientemente Anthropic y otros. (El razonamiento puede mejorar la precisión, pero a costa de aumentar la latencia). Si el lanzamiento es bien recibido, OpenAI podría seguir con modelos adicionales, posiblemente incluyendo modelos más pequeños.
En comentarios anteriores, el CEO de OpenAI, Sam Altman, expresó que cree que la empresa ha estado en el lado equivocado de la historia en lo que respecta a la apertura de sus tecnologías. “[Personalmente creo que necesitamos] encontrar una estrategia de código abierto diferente”, dijo Altman durante una sesión de preguntas y respuestas en Reddit en enero. “No todos en OpenAI comparten esta opinión, y tampoco es nuestra prioridad más alta […] Produciremos mejores modelos [en el futuro], pero mantendremos menos ventaja que en años anteriores”. Altman también mencionó que el próximo modelo abierto de OpenAI será evaluado exhaustivamente para garantizar su seguridad. Fuentes indican que la empresa planea lanzar una “tarjeta del modelo”, un informe técnico detallado que muestre los resultados de las pruebas internas y externas de evaluación y seguridad de OpenAI.
“[Antes del lanzamiento, evaluaremos este modelo de acuerdo con nuestro marco de preparación, como lo haríamos con cualquier otro modelo]”, dijo Altman en una publicación en X el mes pasado. “[Y haremos trabajo adicional dado que sabemos que este modelo será modificado después del lanzamiento]”. OpenAI ha generado críticas de algunos éticos de la IA por supuestamente apresurar las pruebas de seguridad de modelos recientes y no haber lanzado tarjetas de modelo para otros. Altman también ha sido acusado de engañar a los ejecutivos de OpenAI sobre las revisiones de seguridad de los modelos antes de su breve salida en noviembre de 2023. Hemos contactado a OpenAI para obtener comentarios y actualizaremos este artículo si recibimos respuesta.


