OpenAI ha lanzado una nueva función de generación de imágenes en su API, lo que permite a los desarrolladores integrarla en sus aplicaciones y servicios. Esta herramienta, que se hizo popular por su capacidad de crear imágenes realistas al estilo Ghibli y figuras de acción generadas por IA, fue presentada para la mayoría de los usuarios de ChatGPT a finales de marzo. Aunque ha traído millones de nuevos registros para ChatGPT, también ha puesto a prueba la capacidad de la empresa. En la primera semana de disponibilidad, más de 130 millones de usuarios de ChatGPT generaron más de 700 millones de imágenes.
La generación de imágenes en la API de OpenAI utiliza un modelo de IA llamado “gpt-image-1”. Este modelo multimodal puede crear imágenes en diferentes estilos, seguir pautas personalizadas, utilizar conocimientos del mundo y renderizar texto. Los desarrolladores pueden generar varias imágenes a la vez y controlar la calidad y velocidad de la generación. OpenAI asegura que gpt-image-1 tiene las mismas medidas de seguridad que la generación de imágenes en ChatGPT, evitando la creación de contenido que infrinja sus políticas. También se puede ajustar la sensibilidad de moderación, permitiendo un filtrado estándar o uno menos restrictivo.
Además, todas las imágenes generadas con gpt-image-1 llevan una marca de agua con metadatos C2PA, lo que permite identificarlas como generadas por IA en plataformas y aplicaciones compatibles. En cuanto a precios, se cobra $5 por cada millón de tokens de entrada para texto, $10 por cada millón de tokens de entrada para imágenes y $40 por cada millón de tokens de salida para imágenes. Esto se traduce en aproximadamente 2 centavos, 7 centavos y 19 centavos por imagen generada de baja, media y alta calidad, respectivamente.
Empresas como Adobe, Airtable, Wix, Instacart, GoDaddy, Canva y Figma ya están utilizando o probando gpt-image-1. Por ejemplo, la plataforma Figma Design permite a los usuarios generar y editar imágenes a través de este modelo, mientras que Instacart lo está probando para crear imágenes de recetas y listas de compras.


