Odyssey es una startup creada por pioneros en autos autónomos, Oliver Cameron y Jeff Hawke. Han desarrollado un modelo de inteligencia artificial que permite a los usuarios “interactuar” con videos en streaming. Actualmente, está disponible en una “demostración temprana” en la web, donde genera y transmite cuadros de video cada 40 milisegundos. Con controles básicos, los espectadores pueden explorar diferentes áreas dentro de un video, similar a un videojuego en 3D. Según Odyssey, el modelo intenta predecir el siguiente estado del mundo basándose en la situación actual, acciones previas y un historial de eventos.
Este nuevo modelo de mundo permite generar píxeles que se ven realistas, mantener la coherencia espacial, aprender acciones a partir de videos y ofrecer transmisiones de video coherentes durante 5 minutos o más. Odyssey describe su tecnología como “video interactivo”, que es gratuito para que cualquiera lo pruebe, siempre que cuente con la capacidad de procesamiento adecuada.
Varias startups y grandes empresas tecnológicas, como DeepMind y Microsoft, están explorando modelos de mundo, creyendo que podrían usarse para crear medios interactivos, como juegos y películas, y realizar simulaciones realistas, como entornos de entrenamiento para robots. Sin embargo, hay opiniones divididas entre los creativos. Una investigación reciente de Wired reveló que estudios de videojuegos, como Activision Blizzard, están utilizando IA para reducir costos y enfrentar despidos. Además, un estudio de 2024 estimó que más de 100,000 empleos en cine, televisión y animación en EE. UU. se verán afectados por la IA en los próximos meses.
Odyssey se compromete a colaborar con profesionales creativos y no a reemplazarlos. La empresa afirma que el video interactivo abre la puerta a nuevas formas de entretenimiento, donde las historias pueden generarse y explorarse bajo demanda, sin las limitaciones de la producción tradicional. Creen que todo lo que hoy es video —entretenimiento, publicidad, educación, entrenamiento, viajes y más— evolucionará hacia el video interactivo.
La demostración de Odyssey aún tiene algunos problemas, como entornos borrosos y distorsionados que no siempre mantienen la misma disposición. Sin embargo, la compañía promete mejorar rápidamente el modelo, que actualmente puede transmitir video a 30 cuadros por segundo utilizando clusters de GPUs Nvidia H100, con un costo de $1 a $2 por “hora de usuario”.
Odyssey está investigando representaciones de mundo más ricas que capturen dinámicas de manera más fiel, mientras aumenta la estabilidad temporal y el estado persistente. Además, están expandiendo el espacio de acción para incluir interacciones con el mundo, aprendiendo acciones abiertas a partir de videos a gran escala. A diferencia de muchos laboratorios de IA, Odyssey ha diseñado un sistema de cámara montada en una mochila para capturar paisajes reales, creyendo que esto puede servir como base para modelos de mayor calidad. Hasta ahora, han recaudado $27 millones de inversores, incluyendo EQT Ventures y GV, y Ed Catmull, cofundador de Pixar, forma parte de su junta directiva. En diciembre pasado, Odyssey anunció que estaba trabajando en software que permite a los creadores cargar escenas generadas por sus modelos en herramientas como Unreal Engine, Blender y Adobe After Effects para editarlas manualmente.


