OpenAI anunció el lunes el lanzamiento de una nueva versión de su agente de codificación AI, Codex, llamada GPT-5-Codex. Este nuevo modelo es más dinámico en su forma de “pensar” en comparación con versiones anteriores, lo que le permite dedicar desde unos pocos segundos hasta siete horas a una tarea de codificación. Esto significa que tiene un mejor rendimiento en pruebas de codificación.
GPT-5-Codex ya está disponible en productos de Codex, accesibles a través de terminales, IDE, GitHub o ChatGPT, para usuarios de ChatGPT Plus, Pro, Business, Edu y Enterprise. OpenAI también planea ofrecer este modelo a clientes de API en el futuro. Esta actualización forma parte de los esfuerzos de OpenAI para hacer que Codex sea más competitivo frente a otras herramientas de codificación AI, como Claude Code, Cursor de Anysphere o GitHub Copilot de Microsoft.
El mercado de herramientas de codificación AI se ha vuelto más concurrido en el último año debido a la alta demanda de los usuarios. Cursor superó los 500 millones de dólares en ingresos anuales a principios de 2025, y Windsurf, un editor de código similar, experimentó un intento caótico de adquisición que dividió a su equipo entre Google y Cognition.
OpenAI afirma que GPT-5-Codex supera a GPT-5 en pruebas de habilidades de codificación y en tareas de refactorización de código de grandes repositorios. Además, se entrenó a GPT-5-Codex para realizar revisiones de código, y se pidió a ingenieros de software experimentados que evaluaran los comentarios del modelo. Los ingenieros encontraron que GPT-5-Codex cometía menos errores y ofrecía más comentarios de “alto impacto”.
Alexander Embiricos, líder del producto Codex en OpenAI, explicó que gran parte del aumento en el rendimiento se debe a las habilidades de “pensamiento” dinámico de GPT-5-Codex. Los usuarios pueden estar familiarizados con el enrutador de GPT-5 en ChatGPT, que dirige las consultas a diferentes modelos según la complejidad de la tarea. Embiricos mencionó que GPT-5-Codex funciona de manera similar, pero sin un enrutador, ajustando en tiempo real cuánto tiempo dedicar a una tarea. Esto le permite decidir, por ejemplo, que necesita más tiempo para resolver un problema incluso después de haber comenzado a trabajar en él. Embiricos ha observado que, en algunos casos, el modelo puede tardar más de siete horas en completar una tarea.

