La empresa de generación de imagen y vídeo por IA Runway ha presentado GWM‑1, su primer ‘world model’, entrando de lleno en la carrera por este tipo de sistemas junto a gigantes como Google DeepMind, Nvidia y otros laboratorios de IA. Un ‘world model’ es un sistema capaz de aprender una simulación interna de cómo funciona el mundo físico —incluyendo tiempo, movimiento y causalidad— para poder razonar y planificar sin haber visto todos los casos posibles en la realidad.
GWM‑1 se basa en predicción fotograma a fotograma: genera vídeo simulando cómo evolucionan los objetos y el entorno, con comprensión de física, geometría y luz. Runway afirma que su modelo es más general que competidores como Genie‑3 de Google y lo orienta a tres grandes aplicaciones, con variantes específicas:
• GWM‑Worlds: una app que permite crear mundos interactivos a partir de texto o de una imagen de referencia. A medida que el usuario explora la escena, el modelo genera el entorno en tiempo real a 24 fps y resolución 720p. Aunque es útil para videojuegos y contenido inmersivo, Runway destaca su potencial para entrenar agentes que aprendan a moverse y comportarse en entornos físicos simulados.
• GWM‑Robotics: centrado en robótica, utiliza datos sintéticos y escenarios generados con variaciones de clima, obstáculos y condiciones cambiantes. La idea es entrenar robots de forma segura, detectar en qué situaciones podrían incumplir instrucciones o políticas, y mejorar su comportamiento antes de desplegarlos en el mundo real. Runway ofrecerá este modelo vía SDK y ya negocia con empresas de robótica y grandes corporaciones para usarlo.
• GWM‑Avatars: orientado a crear avatares humanos realistas que simulan comportamiento y comunicación, compitiendo con empresas como D‑ID, Synthesia, Soul Machines y las soluciones de avatares de Google. La compañía planea que, a largo plazo, Worlds, Robotics y Avatars converjan en un único modelo unificado.
Además de GWM‑1, Runway ha actualizado su modelo de vídeo Gen 4.5, que ya había superado a Google y OpenAI en el ranking Video Arena. La nueva versión añade generación nativa de audio y capacidades de vídeo largo y multi‑plano: permite crear clips de hasta un minuto con consistencia de personajes, diálogos generados por IA, sonido de fondo y planos complejos desde varios ángulos. También ofrece edición de audio y de vídeos multi‑shot de cualquier duración. Este salto acerca a Runway a la propuesta ‘todo en uno’ de su rival Kling y refuerza la idea de que los modelos de vídeo pasan de ser prototipos de laboratorio a herramientas listas para producción.
Las novedades de Runway consolidan la tendencia hacia modelos de IA que no solo generan imágenes o vídeos aislados, sino que construyen simulaciones coherentes del mundo físico. Esto abre puertas a nuevos usos en entretenimiento, robótica, formación y mundos virtuales, pero también plantea preguntas sobre seguridad, control de agentes autónomos y el impacto económico de una simulación cada vez más realista del mundo.


