Google DeepMind ha comenzado a abrir el acceso a Project Genie, una herramienta experimental de inteligencia artificial capaz de crear mundos interactivos de videojuegos a partir de simples descripciones de texto o imágenes. Desde este jueves, los suscriptores de Google AI Ultra en Estados Unidos podrán probar este prototipo de investigación, que combina el modelo de mundos Genie 3, el generador de imágenes Nano Banana Pro y Gemini.
El objetivo de DeepMind es recopilar comentarios y datos de uso para acelerar el desarrollo de sus modelos de mundo, sistemas de IA que aprenden una representación interna de un entorno para predecir qué pasará después y planificar acciones. Muchos expertos los consideran una pieza clave en el camino hacia la inteligencia artificial general (AGI). En el corto plazo, la apuesta comercial pasa por los videojuegos y el entretenimiento, con vistas a entrenar en el futuro robots y agentes en entornos simulados.
Con Project Genie, el usuario comienza describiendo por texto el escenario y el personaje principal. Nano Banana Pro genera una imagen base —que se puede retocar— y, a partir de ella, Genie construye un mundo explorable en primera o tercera persona. También es posible usar fotos reales como punto de partida, remixar mundos ya creados, explorar una galería de ejemplos y descargar vídeos de las exploraciones. Sin embargo, el sistema solo ofrece por ahora 60 segundos de generación y navegación por sesión debido a las fuertes demandas de computación de Genie 3.
Los investigadores de DeepMind admiten que el proyecto está en fase muy temprana: a veces crea mundos jugables y sorprendentes, y otras ofrece resultados confusos. Funciona especialmente bien con estilos artísticos (acuarela, anime, cartoon) y entornos fantasiosos —como castillos de nubes hechos de malvaviscos en estilo claymation—, pero falla cuando se le exige fotorrealismo, dando como resultado escenas que se sienten “como un videojuego” más que como vídeo real. Tampoco siempre replica con precisión espacios reales cuando se le dan fotografías.
En cuanto a interacción, los personajes pueden atravesar paredes u objetos y el sistema de control mediante teclado se siente torpe, sobre todo para usuarios no familiarizados con juegos. Aun así, el modelo muestra cierta memoria del entorno: en muchas pruebas, al volver sobre una zona ya visitada ésta se mantenía estable, con pequeñas inconsistencias.
Las fuertes barreras de seguridad también marcan la experiencia: no permite generar desnudos ni contenidos que se acerquen a personajes o universos protegidos por derechos de autor, en especial los de Disney, que envió a Google una carta de cese y desistimiento por presunta infracción masiva de copyright. Por esa razón, Genie bloquea incluso mundos que podrían recordar vagamente a princesas de hielo o sirenas fantásticas.
DeepMind insiste en que Project Genie no es todavía un producto acabado, sino una ventana temprana a una nueva forma de crear y explorar mundos digitales. Su apuesta es que, aunque limitado y a veces errático, ofrece ya una muestra de algo “único” que hoy no se puede conseguir por otras vías.


