OpenAI anunció el lanzamiento de o3 y o4-mini, nuevos modelos de inteligencia artificial diseñados para pausar y reflexionar sobre las preguntas antes de responder. La compañía considera que o3 es su modelo de razonamiento más avanzado hasta la fecha, superando a los modelos anteriores en pruebas de matemáticas, programación, razonamiento, ciencia y comprensión visual. Por su parte, o4-mini ofrece un equilibrio competitivo entre precio, velocidad y rendimiento, factores importantes para los desarrolladores al elegir un modelo de IA para sus aplicaciones.
A diferencia de los modelos de razonamiento anteriores, o3 y o4-mini pueden generar respuestas utilizando herramientas en ChatGPT, como navegación web, ejecución de código en Python, procesamiento de imágenes y generación de imágenes. Desde hoy, estos modelos, junto con una variante de o4-mini llamada o4-mini-high, que dedica más tiempo a elaborar respuestas para mejorar su fiabilidad, están disponibles para los suscriptores de los planes Pro, Plus y Team de OpenAI.
Estos nuevos modelos forman parte del esfuerzo de OpenAI por superar a competidores como Google, Meta, xAI, Anthropic y DeepSeek en la intensa carrera global por la inteligencia artificial. Aunque OpenAI fue la primera en lanzar un modelo de razonamiento, o1, otros competidores rápidamente siguieron con versiones que igualan o superan el rendimiento de los modelos de OpenAI. De hecho, los modelos de razonamiento han comenzado a dominar el campo a medida que los laboratorios de IA buscan maximizar el rendimiento de sus sistemas.
O3 casi no se lanzó en ChatGPT. El CEO de OpenAI, Sam Altman, indicó en febrero que la compañía planeaba dedicar más recursos a una alternativa sofisticada que incorporara la tecnología de o3. Sin embargo, la presión competitiva llevó a OpenAI a cambiar de rumbo. OpenAI afirma que o3 logra un rendimiento de vanguardia en benchmarks como Codeforces y SWE-bench, y que o3 y o4-mini son sus primeros modelos que pueden “pensar con imágenes”. En la práctica, los usuarios pueden subir imágenes a ChatGPT, como bocetos en pizarras o diagramas de PDFs, y los modelos analizarán las imágenes durante su fase de “cadena de pensamiento” antes de responder. Gracias a esta nueva capacidad, o3 y o4-mini pueden entender imágenes borrosas y de baja calidad, y realizar tareas como acercar o rotar imágenes mientras razonan.
Además de las capacidades de procesamiento de imágenes, o3 y o4-mini pueden ejecutar código en Python directamente en el navegador a través de la función Canvas de ChatGPT, y buscar en la web cuando se les pregunta sobre eventos actuales. Junto a ChatGPT, los tres modelos —o3, o4-mini y o4-mini-high— estarán disponibles a través de los puntos de acceso para desarrolladores de OpenAI, permitiendo a los ingenieros construir aplicaciones con los modelos de la compañía a tarifas basadas en el uso. En las próximas semanas, OpenAI planea lanzar o3-pro, una versión de o3 que utiliza más recursos computacionales para producir sus respuestas, exclusivamente para suscriptores de ChatGPT Pro.
El CEO de OpenAI, Sam Altman, ha indicado que o3 y o4-mini podrían ser sus últimos modelos de razonamiento de IA independientes en ChatGPT antes del lanzamiento de GPT-5, un modelo que la compañía ha dicho unificará modelos tradicionales como GPT-4.1 con sus modelos de razonamiento.


