Midjourney ha lanzado su primer modelo de video con inteligencia artificial, llamado V1. Este modelo permite a los usuarios animar imágenes en clips de movimiento de cinco segundos. La herramienta es relativamente asequible y podría competir con Google Veo o Sora de OpenAI. Midjourney ha sido conocido por su capacidad de crear imágenes, pero ahora se adentra en el mundo del video con su modelo V1.
Este nuevo modelo está disponible para la comunidad de 20 millones de usuarios de Midjourney, quienes pueden crear clips de cinco segundos basados en sus imágenes y extenderlos hasta 20 segundos en incrementos de cinco segundos. Aunque es un nuevo proyecto para Midjourney, el modelo V1 tiene características que lo comparan con modelos rivales como Sora de OpenAI y Veo 3 de Google, especialmente en cuanto a precio.
Actualmente, Midjourney V1 está en versión beta en la web, donde los usuarios pueden gastar créditos para animar cualquier imagen que creen en la plataforma o que suban. Para hacer un video, solo necesitas generar una imagen en Midjourney como de costumbre, hacer clic en “Animar”, elegir tus configuraciones de movimiento y dejar que la IA haga su trabajo. También puedes subir una imagen, marcarla como el fotograma inicial y escribir un aviso de movimiento personalizado. Puedes dejar que la IA decida cómo moverse o describir cómo quieres que sea el movimiento. Tienes la opción de elegir entre movimiento suave o rápido, dependiendo de si prefieres una animación tranquila o una escena más agitada.
Los resultados que he visto encajan en el momento actual de la producción de videos con IA, con ejemplos buenos y otros no tanto. La “valle inquietante” siempre está presente, pero hay ejemplos sorprendentemente buenos tanto de Midjourney como de los primeros usuarios.
Midjourney no intenta competir directamente con Sora o Veo en términos de potencia técnica. Estos modelos producen videos de calidad cinematográfica en 4K con iluminación fotorrealista y narrativas largas basadas solo en texto. Están entrenados con terabytes de datos y enfatizan la consistencia de fotogramas y la estabilidad temporal, algo que Midjourney no promete ofrecer.
La herramienta de video de Midjourney no pretende ser la próxima línea de CGI de Hollywood. Su enfoque es ser fácil y divertida de usar para artistas independientes o entusiastas de los medios de IA. Además, es bastante económica. Según Midjourney, un trabajo de video cuesta aproximadamente lo mismo que escalar una imagen, o el costo de un segundo de video. Esto es 25 veces más barato que la mayoría de los servicios de video con IA en el mercado.
Esto es probablemente lo mejor, ya que muchas productoras de Hollywood están demandando a Midjourney. La compañía enfrenta una demanda importante de varios estudios, incluidos Disney y Universal, por supuestamente haber entrenado sus modelos con contenido protegido por derechos de autor.
Por ahora, los generadores de imágenes y videos de IA de Midjourney siguen activos, y la compañía planea expandir sus capacidades de producción de video. Midjourney está insinuando planes a largo plazo para renderizado 3D completo, control de escenas e incluso exploración de mundos inmersivos. Esta primera versión es solo un primer paso.
Los defensores de Sora y Veo probablemente no deban entrar en pánico todavía, pero deberían estar atentos a los planes de Midjourney, porque mientras ellos están ocupados construyendo la versión de IA de un equipo de cámaras de estudio, Midjourney acaba de entregar un libro de animación mágico a cualquiera que tenga un poco de dinero para sus créditos.


