No pasa un día sin que aparezca una nueva tendencia de imágenes generadas por ChatGPT en tus redes sociales. Hace unos días, por ejemplo, se trataba de convertir tus fotos en arte renacentista. Pero, ¿por qué no ves lo mismo con Gemini, si también puede generar imágenes con inteligencia artificial? La razón es que la tendencia de generación de imágenes comenzó después de que ChatGPT recibiera una importante actualización en marzo, mientras que Gemini aún dependía de Imagen 3, que tenía algunas limitaciones. Sin embargo, ayer en Google I/O, todos los usuarios de Gemini (tanto gratuitos como de pago) recibieron una actualización gratuita a Imagen 4, que ofrece una calidad de imagen y tipografía mucho mejores, además de la capacidad de producir imágenes de hasta 2K de resolución y usar tamaños de imagen fuera de la relación 1:1.
Lo mejor de todo es que Imagen 4 ya está disponible, y puedes usarla simplemente visitando gemini.google.com o utilizando la aplicación móvil. La gran pregunta es: ¿puedes ahora usar la nueva Imagen 4 en Gemini para reemplazar a ChatGPT en la generación de imágenes? Vamos a averiguarlo.
Primero, analicemos los límites. Google es bastante claro sobre cuántas imágenes puedes generar al día. En Gemini, los usuarios gratuitos pueden generar de 10 a 20 imágenes al día, mientras que los suscriptores de Gemini Advanced pueden generar de 100 a 150, dependiendo de la demanda del servidor. Con ChatGPT, los límites de uso son menos claros y varían mucho más dependiendo de cuántas personas lo estén utilizando. Por ejemplo, actualmente ChatGPT me dice que la generación de imágenes no está disponible para usuarios gratuitos, mientras que los suscriptores de ChatGPT Plus pueden generar “unas pocas docenas de imágenes por día”. Aun así, me permitió generar una imagen en la versión gratuita, y normalmente he encontrado que puedo obtener alrededor de tres o cuatro imágenes al día antes de alcanzar mi límite en el nivel gratuito.
Para probar Gemini contra ChatGPT, decidí usar una cuenta de ChatGPT Plus y una cuenta de Gemini Advanced para no preocuparme por los límites de uso. También utilicé indicaciones proporcionadas por OpenAI y Google para comparar la generación de imágenes. Dado que estas indicaciones fueron proporcionadas por las empresas, probablemente resaltaron las habilidades particulares de cada generador de imágenes, así que dividí las pruebas equitativamente entre las indicaciones generadas por Google y OpenAI.
En la primera prueba, utilicé una indicación proporcionada por Google que pedía una imagen cinematográfica de un pasajero joven con cabello rojo. Gemini generó una imagen impresionante que realmente mostró el poder de Imagen 4, mientras que ChatGPT ofreció una imagen menos realista y más oscura. En esta prueba, Gemini fue el claro ganador.
En la segunda prueba, pedí una fotografía estilo Polaroid de cuatro amigos en un bar. Aunque ninguno de los dos generadores hizo un buen trabajo representando un grupo diverso, ChatGPT logró mostrar el número correcto de personas, por lo que fue el ganador.
En la tercera prueba, pedí una imagen con texto. Gemini mostró una gran mejora en tipografía, pero ChatGPT cometió algunos errores en el texto, así que Gemini ganó esta ronda.
En la cuarta prueba, pedí una imagen con muchos textos. Aunque Gemini fue más brillante, ChatGPT fue mejor en la generación de señales de tráfico, lo que lo convirtió en el ganador.
En general, creo que Imagen 4 en Gemini es impresionante. Me encanta el nivel de detalle en sus imágenes, que parecen más brillantes que las generadas por ChatGPT. Además, Gemini genera imágenes en segundos, mientras que ChatGPT tarda más. Sin embargo, ChatGPT sigue siendo superior en imágenes con mucho texto y en la transformación de imágenes, donde Gemini no puede competir. Si deseas crear una imagen de IA desde cero, Gemini es una opción a considerar.


