Los creadores de imágenes con inteligencia artificial pueden ser sorprendentes o incluso preocupantes en sus habilidades. Sin embargo, a menudo presentan un gran problema. Hasta hace poco, si querías editar una imagen generada por IA, solo podías obtener una nueva imagen que esperabas que se pareciera a la original, pero con nuevos problemas. Recientemente, Google Gemini mejoró su creador de imágenes con una función de edición que promete producir una imagen con solo los cambios solicitados, diferenciándose de la versión anterior. ChatGPT también ofrece editar imágenes mediante un texto, pero para mayor precisión, proporciona una herramienta que permite seleccionar la parte de la imagen que deseas cambiar y describir la modificación antes de generar una nueva versión.
Para probar cómo se desempeñan Gemini y ChatGPT en mantener la imagen original y solo cambiar lo que describo, comencé con una imagen base creada por ChatGPT de una mujer sentada en un café al aire libre en París, tomando café, vestida con un abrigo de moda y gafas de sol. Luego, realicé tres solicitudes de edición en ambos, comparando la facilidad y precisión con la que cada uno ejecutó las modificaciones.
Primero, pedí que “cambiara su atuendo a un vestido de verano vibrante y que eliminara las gafas de sol”. Ambos chatbots siguieron la solicitud, pero Gemini se mantuvo más fiel a la imagen original. ChatGPT hizo pequeños ajustes en la expresión de la mujer, el tamaño de la taza, el plato, la mesa y el peinado. Aunque no son cambios drásticos, sí alteran más que solo el atuendo y las gafas. Además, Gemini tardó entre 20 y 30 segundos, mientras que ChatGPT, con un motor más potente, tardó unos minutos.
Luego, añadí un perro a la escena, pidiendo que “agregara un chihuahua sentado a su lado, mirándola con cariño”. ChatGPT creó un adorable cachorro en el regazo de la mujer, pero si era la misma mujer de las imágenes anteriores, había cambiado su peinado y vestido. Gemini, por otro lado, mantuvo la ilusión de que era la misma foto, añadiendo un perro para diferenciarla. Sin embargo, el perro de Gemini parecía estar a punto de caerse de la mesa.
Para la última edición, pedí que “colocaran la Torre Eiffel prominentemente en el fondo”. Gemini eliminó el edificio a la izquierda de la mujer para hacer espacio para la torre, que parecía pequeña pero no fuera de lugar. La imagen mantuvo la continuidad, aunque el perro seguía en una posición incómoda. La Torre Eiffel de Gemini se veía realista, mientras que la de ChatGPT parecía una creación extraña, como si fuera un modelo de madera.
En general, las ediciones de Gemini fueron rápidas y precisas, cambiando principalmente lo que pedí. Es ideal para ediciones rápidas. ChatGPT, aunque ofrece una calidad de imagen superior, tarda más en procesar la solicitud y no siempre acierta a la primera. Es probable que use ChatGPT para crear imágenes, pero recurriré a Gemini si quiero hacer algunos ajustes a una imagen que ya me gusta.


