Meta presentó el miércoles su nuevo modelo de inteligencia artificial V-JEPA 2, un “modelo del mundo” diseñado para ayudar a los agentes de IA a entender su entorno. V-JEPA 2 es una mejora del modelo V-JEPA lanzado el año pasado, que fue entrenado con más de un millón de horas de video. Este conjunto de datos de entrenamiento tiene como objetivo ayudar a robots y otros agentes de IA a operar en el mundo físico, comprendiendo y prediciendo cómo conceptos como la gravedad afectarán lo que sucederá a continuación.
Este tipo de conexiones de sentido común son similares a las que hacen los niños pequeños y los animales a medida que sus cerebros se desarrollan. Por ejemplo, cuando juegas a lanzar la pelota con un perro, se espera que el perro entienda que hacer rebotar la pelota en el suelo hará que rebote hacia arriba, o que debe correr hacia donde cree que caerá la pelota, y no hacia donde está en ese momento.
Meta muestra ejemplos donde un robot puede enfrentarse a situaciones como sostener un plato y una espátula mientras camina hacia una estufa con huevos cocidos. La IA puede predecir que una acción muy probable sería usar la espátula para mover los huevos al plato. Según Meta, V-JEPA 2 es 30 veces más rápido que el modelo Cosmos de Nvidia, que también busca mejorar la inteligencia relacionada con el mundo físico. Sin embargo, Meta podría estar evaluando sus propios modelos según diferentes estándares que Nvidia.
“Creemos que los modelos del mundo abrirán una nueva era para la robótica, permitiendo que los agentes de IA en el mundo real ayuden con tareas domésticas y físicas sin necesidad de cantidades astronómicas de datos de entrenamiento robótico”, explicó Yann LeCun, el científico jefe de IA de Meta, en un video.


