OpenAI anunció el lanzamiento de dos modelos de inteligencia artificial de código abierto que tienen capacidades similares a sus modelos de la serie o. Estos modelos están disponibles para descargar de forma gratuita en la plataforma Hugging Face. La compañía los describe como “de última generación” en comparación con otros modelos abiertos. Los modelos vienen en dos tamaños: el gpt-oss-120b, que es más grande y potente, y puede funcionar en una sola GPU de Nvidia, y el gpt-oss-20b, que es más ligero y puede ejecutarse en una laptop común con 16GB de memoria. Este lanzamiento marca el primer modelo de lenguaje “abierto” de OpenAI desde el GPT-2, que se lanzó hace más de cinco años.
OpenAI explicó que sus modelos abiertos pueden enviar consultas complejas a modelos de inteligencia artificial en la nube. Esto significa que si el modelo abierto de OpenAI no puede realizar una tarea específica, como procesar una imagen, los desarrolladores pueden conectarlo a uno de los modelos cerrados más potentes de la compañía. Aunque OpenAI lanzó modelos de IA de código abierto en sus inicios, ha preferido en general un enfoque de desarrollo cerrado. Esta estrategia le ha permitido construir un gran negocio vendiendo acceso a sus modelos de IA a empresas y desarrolladores.
Sin embargo, el CEO Sam Altman mencionó en enero que cree que OpenAI ha estado “en el lado equivocado de la historia” en lo que respecta a la apertura de sus tecnologías. La compañía enfrenta una creciente presión de laboratorios de IA en China, que han desarrollado varios de los modelos abiertos más capaces y populares del mundo. En julio, la administración de Trump también instó a los desarrolladores de IA en EE. UU. a abrir más tecnología para promover la adopción global de la IA alineada con los valores estadounidenses.
Con el lanzamiento de gpt-oss, OpenAI espera ganarse la aprobación de desarrolladores y del gobierno. Altman afirmó que la misión de OpenAI es asegurar que la inteligencia artificial general (AGI) beneficie a toda la humanidad y que están emocionados de que el mundo construya sobre una base de IA abierta creada en EE. UU.
OpenAI ha trabajado para que su modelo abierto sea un líder entre otros modelos de peso abierto. En pruebas de codificación competitivas, gpt-oss-120b y gpt-oss-20b obtuvieron puntuaciones que superan a algunos modelos competidores, aunque no alcanzaron a otros modelos de OpenAI. Sin embargo, los modelos abiertos de OpenAI tienden a “alucinar” más, es decir, generar respuestas incorrectas o inventadas, en comparación con sus modelos más recientes.
OpenAI afirma que sus modelos abiertos fueron entrenados con procesos similares a los de sus modelos propietarios y utilizan una técnica llamada mezcla de expertos para funcionar de manera más eficiente. El gpt-oss-120b tiene 117 mil millones de parámetros, pero solo activa una parte de ellos para cada pregunta. Además, estos modelos fueron entrenados utilizando aprendizaje por refuerzo en entornos simulados.
A pesar de que los modelos abiertos de OpenAI son textuales y no pueden procesar imágenes o audio, se lanzan bajo la licencia Apache 2.0, que permite a las empresas monetizarlos sin necesidad de pagar o pedir permiso. Sin embargo, OpenAI no liberará los datos de entrenamiento utilizados para crear estos modelos, lo que ha sido motivo de controversia debido a demandas en curso sobre el uso inapropiado de obras con derechos de autor.
OpenAI ha retrasado el lanzamiento de sus modelos abiertos varias veces para abordar preocupaciones de seguridad. La compañía ha investigado si estos modelos podrían ser utilizados para fines maliciosos, aunque no encontró evidencia de que pudieran alcanzar un nivel de peligro alto en esos ámbitos.
A pesar de que el modelo de OpenAI parece ser de última generación entre los modelos abiertos, los desarrolladores esperan con ansias el lanzamiento del modelo de razonamiento de IA R2 de DeepSeek y un nuevo modelo abierto del laboratorio de superinteligencia de Meta.


