Durante una transmisión en vivo el martes, Sam Altman, CEO de OpenAI, anunció una importante actualización en las capacidades de generación de imágenes de ChatGPT, la primera en más de un año. Ahora, ChatGPT puede utilizar el modelo GPT-4o para crear y modificar imágenes y fotos de manera nativa. Hasta ahora, este modelo solo podía generar y editar texto, pero ya no es así.
Altman mencionó que la generación de imágenes nativa con GPT-4o está disponible desde hoy en ChatGPT y Sora, el producto de generación de videos de OpenAI, para los suscriptores del plan Pro de $200 al mes. OpenAI también ha indicado que esta función estará disponible pronto para los usuarios Plus y gratuitos de ChatGPT, así como para los desarrolladores que utilizan su servicio API.
El modelo GPT-4o, que genera imágenes, “piensa” un poco más que el modelo anterior, DALL-E 3, lo que permite crear imágenes más precisas y detalladas. Además, GPT-4o puede editar imágenes existentes, incluyendo aquellas con personas, transformando detalles o “inpainting” objetos en primer y segundo plano.
OpenAI no reveló qué datos de imágenes utilizó para habilitar estas nuevas capacidades de generación de imágenes. Muchas empresas de IA generativa consideran que sus datos de entrenamiento son una ventaja competitiva y, por lo tanto, mantienen esta información en secreto. También, los detalles sobre los datos de entrenamiento pueden ser una fuente de demandas relacionadas con la propiedad intelectual, lo que desincentiva a las empresas a compartir mucho.
OpenAI ofrece un formulario de exclusión que permite a los creadores solicitar que sus obras sean eliminadas de sus conjuntos de datos de entrenamiento. La empresa también afirma que respeta las solicitudes para que sus bots de recopilación web no recojan datos de entrenamiento, incluidas imágenes, de sitios web.
La actualización de la generación de imágenes de ChatGPT llega después de que Google lanzara una salida de imagen nativa experimental para Gemini 2.0 Flash, uno de sus modelos más destacados. Esta poderosa función se volvió viral en las redes sociales, aunque no necesariamente por las mejores razones, ya que su componente de imagen carecía de ciertas restricciones, permitiendo a las personas eliminar marcas de agua y crear imágenes de personajes con derechos de autor.


