Siempre disfruto la oportunidad de experimentar con generadores de videos de inteligencia artificial. Aunque a veces son malos, pueden ser entretenidos, y cuando funcionan bien, son sorprendentes. Por eso, estaba emocionado de probar el nuevo modelo Gen-4 de Runway. La empresa afirma que el Gen-4 (y su versión más pequeña y rápida, Gen-4 Turbo) supera al modelo anterior Gen-3 en calidad y consistencia. Se dice que el Gen-4 logra que los personajes se vean como ellos mismos entre escenas, además de tener movimientos más fluidos y una mejor física ambiental. También se destaca por seguir instrucciones de manera efectiva. Le das una referencia visual y un texto descriptivo, y genera un video que se asemeja a lo que imaginaste. Esto suena muy similar a lo que OpenAI promociona con su creador de videos, Sora.
Aunque los videos que crea Sora suelen ser hermosos, a veces no son confiables en calidad. Una escena puede ser perfecta, y la siguiente puede mostrar personajes flotando como fantasmas o puertas que no llevan a ningún lado. Runway Gen-4 se presenta como magia en video, así que decidí probarlo con la idea de contar la historia de un mago. Ideé una pequeña trilogía de fantasía protagonizada por un mago errante. Quería que el mago conociera a una princesa elfa y luego la persiguiera a través de portales mágicos. Luego, cuando la vuelve a encontrar, ella está disfrazada de un animal mágico, y él la transforma de nuevo en princesa.
El objetivo no era crear un gran éxito de taquilla. Solo quería ver hasta dónde podía llegar Gen-4 con una entrada mínima. Como no tenía fotos de magos reales, aproveché el generador de imágenes mejorado de ChatGPT para crear imágenes fijas convincentes. Sora puede que no esté revolucionando Hollywood, pero no puedo negar la calidad de algunas imágenes producidas por ChatGPT. Hice el primer video y luego utilicé la opción de Runway para “arreglar” una semilla, de modo que los personajes se vieran consistentes en los videos. Junté los tres videos en una sola película con un breve descanso entre cada uno.
Puedes ver que no es perfecto. Hay algunos movimientos extraños de objetos, y las apariencias consistentes no son del todo precisas. Algunos elementos de fondo brillaban de manera extraña, y no pondría estos clips en una pantalla de cine todavía. Sin embargo, el movimiento, la expresión y la emoción de los personajes se sentían sorprendentemente reales.
Me gustaron las opciones de iteración, que no me abrumaron con demasiadas opciones manuales, pero también me dieron suficiente control para sentir que estaba involucrado activamente en la creación y no solo presionando un botón y esperando coherencia.
Ahora, ¿podrá competir con Sora y los muchos socios cineastas profesionales de OpenAI? No, ciertamente no en este momento. Pero probablemente lo probaría si fuera un cineasta aficionado que busca una forma relativamente económica de visualizar algunas de mis ideas. Al menos, antes de gastar mucho dinero en las personas necesarias para hacer que las películas se vean y sientan tan poderosas como mi visión. Y si me siento lo suficientemente cómodo y bueno usando y manipulando la IA para obtener lo que quiero cada vez, podría no pensar en usar Sora. No necesitas ser un mago para ver que ese es el hechizo que Runway espera lanzar a su base de usuarios potenciales.


