Midjourney, una de las startups más populares en generación de imágenes con inteligencia artificial, anunció el miércoles el lanzamiento de su esperado modelo de generación de videos con IA, llamado V1. Este modelo permite a los usuarios subir una imagen, ya sea una foto propia o una generada por otros modelos de Midjourney, y V1 creará un conjunto de cuatro videos de cinco segundos cada uno basados en esa imagen. Al igual que los modelos de imagen de Midjourney, V1 solo está disponible a través de Discord y, por ahora, solo en la web.
El lanzamiento de V1 coloca a Midjourney en competencia con otros modelos de generación de videos de IA, como Sora de OpenAI, Gen 4 de Runway, Firefly de Adobe y Veo 3 de Google. Mientras muchas empresas se enfocan en desarrollar modelos de video controlables para usos comerciales, Midjourney se ha destacado por sus modelos de imagen que atienden a creativos. La compañía tiene metas más ambiciosas para sus modelos de video, buscando crear modelos de IA “capaces de simulaciones en tiempo real en mundos abiertos”.
Después de los modelos de video, Midjourney planea desarrollar modelos de IA para producir renderizados en 3D y modelos de IA en tiempo real. El lanzamiento del modelo V1 se produce justo una semana después de que la startup fue demandada por dos de los estudios de cine más conocidos de Hollywood: Disney y Universal. La demanda alega que las imágenes creadas por los modelos de imagen de Midjourney representan personajes protegidos por derechos de autor, como Homer Simpson y Darth Vader. Los estudios de Hollywood han tenido dificultades para enfrentar la creciente popularidad de los modelos de generación de imágenes y videos con IA, temiendo que estas herramientas puedan reemplazar o devaluar el trabajo de los creativos en sus respectivos campos.
Aunque Midjourney intenta diferenciarse de otras startups de IA enfocándose más en la creatividad que en aplicaciones comerciales inmediatas, no puede escapar de estas acusaciones. Para empezar, Midjourney cobrará ocho veces más por la generación de videos que por la de imágenes, lo que significa que los suscriptores agotarán su cuota mensual de generación de videos mucho más rápido. La forma más económica de probar V1 es suscribiéndose al plan básico de $10 al mes. Los suscriptores de los planes Pro de $60 al mes y Mega de $120 al mes tendrán generaciones de video ilimitadas en el modo “Relax” de la compañía. En el próximo mes, Midjourney reevaluará sus precios para los modelos de video.
V1 incluye algunas configuraciones personalizadas que permiten a los usuarios controlar los resultados del modelo de video. Los usuarios pueden seleccionar una opción de animación automática para hacer que una imagen se mueva aleatoriamente o una opción manual que les permite describir en texto una animación específica que desean agregar a su video. También pueden ajustar la cantidad de movimiento de la cámara y el sujeto seleccionando “bajo movimiento” o “alto movimiento” en la configuración. Aunque los videos generados con V1 son de solo cinco segundos, los usuarios pueden optar por extenderlos hasta cuatro veces, lo que significa que los videos de V1 podrían durar hasta 21 segundos. Al igual que los modelos de imagen de Midjourney, las primeras demostraciones de los videos de V1 tienen un aspecto algo surrealista, en lugar de hiperrealista. La respuesta inicial a V1 ha sido positiva, aunque aún no está claro cómo se compara con otros modelos de video de IA líderes en el mercado, que han estado disponibles durante meses o incluso años.


