En diciembre, OpenAI presentó su modelo de inteligencia artificial o3, en colaboración con los creadores de ARC-AGI, una herramienta diseñada para evaluar la capacidad de las IA. Sin embargo, unos meses después, los resultados han sido revisados y ahora son un poco menos impresionantes de lo que se pensaba. La semana pasada, la Fundación Arc Prize, que gestiona ARC-AGI, actualizó los costos de computación aproximados para o3. Inicialmente, se estimó que la mejor configuración de o3, llamada o3 high, costaba alrededor de $3,000 para resolver un solo problema de ARC-AGI. Ahora, la Fundación Arc Prize cree que el costo es mucho más alto, posiblemente alrededor de $30,000 por tarea.
Esta revisión es importante porque muestra lo costosos que pueden ser los modelos de IA más sofisticados para ciertas tareas, al menos en sus primeras etapas. OpenAI aún no ha fijado un precio para o3 ni lo ha lanzado al público. Sin embargo, la Fundación Arc Prize considera que el precio del modelo o1-pro de OpenAI es un buen indicador. Para dar contexto, o1-pro es el modelo más caro de OpenAI hasta ahora. Mike Knoop, cofundador de la Fundación Arc Prize, comentó que “creemos que o1-pro es una comparación más cercana del verdadero costo de o3, debido a la cantidad de computación utilizada en las pruebas”. Aún así, advierte que esto es solo una estimación y han mantenido a o3 como una vista previa en su tabla de clasificación hasta que se anuncie un precio oficial.
Un alto costo para o3 high no sería sorprendente, dado el gran uso de recursos computacionales que se ha reportado. Según la Fundación Arc Prize, o3 high utilizó 172 veces más computación que o3 low, la configuración de menor capacidad de o3, para abordar ARC-AGI. Además, han circulado rumores sobre planes costosos que OpenAI podría estar considerando para clientes empresariales. A principios de marzo, se informó que la empresa podría cobrar hasta $20,000 al mes por “agentes” de IA especializados, como un agente de desarrollo de software.
Algunos podrían argumentar que incluso los modelos más caros de OpenAI costarán menos que lo que un contratista humano típico cobraría. Sin embargo, como señaló el investigador de IA Toby Ord, los modelos pueden no ser tan eficientes. Por ejemplo, o3 high necesitó 1,024 intentos en cada tarea de ARC-AGI para lograr su mejor puntuación.


