Si alguna vez has paseado por una galería de arte, habrás notado que algunos alumnos de un mismo maestro comparten ciertas sensibilidades y técnicas. Algo similar ocurre con los generadores de imágenes de inteligencia artificial (IA). Adobe ha presentado su nuevo modelo Firefly Image Model 4, que produce imágenes impresionantes. Decidí compararlo con el generador de imágenes recientemente mejorado de ChatGPT. Los resultados me hicieron pensar en dos jóvenes pero talentosos estudiantes de arte que aún no han desarrollado sus estilos personales. Ambos siguen de cerca los métodos de su maestro y producen resultados muy buenos, pero similares.
Realicé varias pruebas con ambos modelos para ver qué imágenes generaban. Las creaciones de Firefly están a la izquierda y las de ChatGPT a la derecha.
Empecé con un retrato, ya que las imágenes realistas de personas son muy demandadas. Pedí a ambas herramientas de IA que crearan “Un retrato en primer plano de una mujer pelirroja con ojos azul-grises y un ligero toque de pecas, usando un sombrero de paja, de pie en un campo de girasoles durante la hora dorada.” Los dos personajes virtuales parecen primos, si no hermanos. Los labios, la textura del cabello e incluso la forma del sombrero son casi idénticos. La “foto” de Firefly podría haber sido tomada en un día más cálido, pero la similitud es notable. Sin información previa, sería difícil identificar cuál modelo generó cada resultado, pero claramente ambos se entrenaron con bases de datos fotográficas que contienen algunas de las mismas personas.
Luego, quise ver cómo se desempeñaban en una escena compleja y caótica. Como fanático de las películas de serie B, pedí a las dos herramientas de IA que crearan “Un laboratorio de ciencia ficción en caos, con cristales rotos, luces parpadeantes, científicos corriendo, robots fallando y especímenes alienígenas brillantes escapando de su contención.” Aquí hubo una notable divergencia. Firefly se centró en los robots, mientras que ChatGPT enfatizó el aspecto alienígena, aunque algunos de los alienígenas también podrían ser robots. Ambos lograron llenar la imagen de actividad de diferentes maneras. Le daría una ligera ventaja a ChatGPT, en parte por los cerebros alienígenas y en parte por la forma en que los científicos corrían por sus vidas.
Después, decidí ver cómo se desempeñaban al crear un desayuno (digital). La comida puede ser complicada de representar con IA, y es evidente cuando hay errores. Por eso, pedí que mostraran: “Una vista desde arriba de un desayuno gourmet, incluyendo panqueques, bayas y un latte con arte en la espuma.” Ambos modelos estaban ansiosos por mostrar sus bayas. Las opciones de Firefly parecían un camión volcado sobre el plato, y ChatGPT parecía pensar que soy un niño que consume bayas hasta explotar. Sin embargo, los panqueques de ambos lucen comestibles. La convergencia volvió a aparecer con el arte del latte. No especifiqué qué debería ser, pero ambos presentaron un arte de helecho con un corazón en la parte superior, aunque una de las tazas de Firefly parecía tener mucha canela derramada.
Finalmente, decidí añadir más detalles al prompt. Pedí a Firefly y ChatGPT que crearan “Un majestuoso dragón con escamas iridiscentes posado en la cima de una montaña nevada al amanecer, con sus enormes alas completamente extendidas mientras respira una corriente de fuego que se curva en las palabras ‘Sueña en Grande’ en letras audaces y ardientes.” Hay trillones de pinturas y descripciones de dragones, y las únicas especificaciones que pedí fueron escamas iridiscentes y que fuera majestuoso. De alguna manera, tanto Firefly como ChatGPT produjeron dragones con el mismo collar de cuernos alrededor de la cara y colas casi similares a las de un dinosaurio. Firefly parecía más interesado en el paisaje que en la caligrafía de las palabras. ChatGPT, en cambio, tomó en serio la parte de las letras audaces y ardientes, haciendo que las de Firefly parecieran casi arte de clip. La pose del dragón de ChatGPT también es más dinámica e interesante. Pero, de nuevo, podrían haber sido dos jóvenes pintores al lado de su maestro, mientras este daba consejos sobre cómo se ve la luz al amanecer en las montañas.
Tanto Firefly Image 4 como ChatGPT pueden crear imágenes hermosas, extrañas o inquietantes. Distinguir entre los dos modelos es más complicado. Ambos saben cómo hacer un rostro humano; de hecho, pueden crear rostros que parecen familiares. Ambos pueden representar escenas ocupadas, deletrear palabras (en fuego) e incluso hacer un desayuno. Estos modelos y otros similares han alcanzado un punto en el que elegir uno para usar depende tanto del presupuesto y otros productos de la empresa que deseas utilizar, como de la calidad de la imagen o el gusto personal.


