Physical Intelligence, una startup de robótica de San Francisco con apenas dos años de vida y más de 1.000 millones de dólares levantados, ha presentado π0.7, un nuevo modelo de IA que apunta a convertirse en un “cerebro generalista” para robots. A diferencia del enfoque tradicional —entrenar un modelo distinto para cada tarea concreta— π0.7 demuestra capacidad de generalización composicional: combina habilidades aprendidas en contextos distintos para resolver tareas que nunca vio durante su entrenamiento.
El ejemplo más llamativo es el de una freidora de aire prácticamente ausente del conjunto de datos. Con solo dos episodios vagamente relacionados en todo el entrenamiento, el modelo fue capaz de usar el aparato para cocinar un boniato. Sin instrucciones, hizo un intento razonable; con una guía verbal paso a paso de un humano, completó la tarea con éxito. Los investigadores explican que, afinando durante media hora la forma de “hablarle” al modelo (prompt engineering), la tasa de éxito en algunos experimentos pasó del 5% al 95%.
π0.7 aún tiene limitaciones claras: no puede ejecutar de forma autónoma tareas largas a partir de una sola orden del tipo “hazme unas tostadas”, ni existen benchmarks estándar que permitan validar externamente todos los resultados. Por eso el equipo compara el modelo con sus propios sistemas especialistas anteriores, logrando igualar su desempeño en tareas como hacer café, doblar ropa o montar cajas. Aun así, lo que más sorprende a los propios científicos es que el modelo esté logrando comportamientos que no esperaban a partir de los datos disponibles, algo que recuerdan al salto que supusieron los grandes modelos de lenguaje.
La empresa, cofundada por el reputado inversor Lachy Groom y el académico Sergey Levine (UC Berkeley), mantiene un discurso prudente: habla de “signos tempranos” de generalización y evita prometer plazos de comercialización, aunque ya se la valora en 5.600 millones de dólares y se especula con una nueva ronda que podría elevar su valoración a 11.000 millones. Para los investigadores, lo relevante no son las acrobacias llamativas, sino que los robots empiecen a generalizar de forma útil en tareas cotidianas, abriendo la puerta a máquinas que puedan aprender en tiempo real con explicaciones en lenguaje natural.


