OpenAI está actualizando el modelo de inteligencia artificial que impulsa a Operator, su agente que puede navegar por la web de forma autónoma y utilizar ciertos programas dentro de una máquina virtual en la nube. Pronto, Operator utilizará un modelo basado en o3, uno de los más recientes en la serie de modelos de “razonamiento” de OpenAI. Anteriormente, Operator dependía de una versión personalizada de GPT-4o. Según varios criterios de evaluación, o3 es un modelo mucho más avanzado, especialmente en tareas que involucran matemáticas y razonamiento.
OpenAI anunció en un blog que están reemplazando el modelo basado en GPT-4o de Operator por una versión basada en o3. Sin embargo, la versión API de Operator seguirá utilizando el modelo 4o. Operator es solo una de las muchas herramientas que han lanzado las empresas de inteligencia artificial en los últimos meses. Las compañías están compitiendo para crear agentes sofisticados que puedan realizar tareas de manera confiable y casi sin supervisión. Por ejemplo, Google ofrece un agente de “uso de computadora” a través de su API Gemini, que también puede navegar por la web y realizar acciones en nombre de los usuarios, además de una opción más centrada en el consumidor llamada Mariner. Los modelos de Anthropic también pueden llevar a cabo tareas informáticas, como abrir archivos y navegar por páginas web.
Según OpenAI, el nuevo modelo de Operator, llamado o3 Operator, fue “ajustado con datos adicionales de seguridad para el uso de computadoras”, incluyendo conjuntos de datos diseñados para “enseñar al modelo los límites de decisión de OpenAI sobre confirmaciones y rechazos”. OpenAI ha publicado un informe técnico que muestra el rendimiento de o3 Operator en evaluaciones de seguridad específicas. En comparación con el modelo GPT-4o, o3 Operator tiene menos probabilidades de negarse a realizar actividades “ilícitas” y buscar datos personales sensibles, y es menos susceptible a un tipo de ataque de IA conocido como inyección de comandos, según el informe técnico. OpenAI mencionó que “o3 Operator utiliza el mismo enfoque de seguridad en múltiples capas que usamos para la versión 4o de Operator”. Aunque o3 Operator hereda las capacidades de codificación de o3, no tiene acceso nativo a un entorno de codificación o terminal.


