Una de las startups de inteligencia artificial más destacadas de Europa ha lanzado dos modelos de IA tan pequeños que los han nombrado como el cerebro de un pollo y el cerebro de una mosca. Multiverse Computing afirma que estos son los modelos más pequeños del mundo que aún ofrecen un alto rendimiento y pueden manejar chat, voz e incluso razonamiento en un caso. Estos nuevos modelos están diseñados para integrarse en dispositivos de Internet de las Cosas (IoT) y funcionar localmente en smartphones, tabletas y PCs.
“Podemos comprimir el modelo tanto que puede caber en los dispositivos”, dijo Orús a TechCrunch. “Puedes ejecutarlos directamente en tu iPhone o en tu Apple Watch”. Multiverse Computing, con sede en Donostia, España, fue cofundada por el profesor de computación cuántica y física Román Orús, el experto en computación cuántica Samuel Mugel y Enrique Lizaso Olmos, ex CEO adjunto de Unnim Banc. La empresa recaudó 189 millones de euros (unos 215 millones de dólares) en junio gracias a una tecnología de compresión de modelos que llaman “CompactifAI”. Desde su fundación en 2019, ha recaudado alrededor de 250 millones de dólares, según Orús.
CompactifAI es un algoritmo de compresión inspirado en la computación cuántica que reduce el tamaño de los modelos de IA existentes sin perder rendimiento. “Tenemos una tecnología de compresión que no es la típica que se utiliza en informática o aprendizaje automático, porque venimos de la física cuántica”, explicó. “Es un algoritmo de compresión más sutil y refinado”. La compañía ya ha lanzado versiones comprimidas de modelos de código abierto, incluyendo modelos pequeños populares como Llama 4 Scout o Mistral Small 3.1, y recientemente lanzó versiones comprimidas de dos nuevos modelos abiertos de OpenAI.
Sus dos nuevos modelos son tan pequeños que pueden llevar capacidades de IA conversacional a casi cualquier dispositivo IoT y funcionar sin conexión a Internet. La empresa se refiere a esta familia de modelos como el “Zoo de Modelos” porque los nombra según el tamaño de los cerebros de los animales. Uno de los modelos, llamado SuperFly, es una versión comprimida del modelo de código abierto SmolLM2 135 de Hugging Face. El original tiene 135 millones de parámetros y fue desarrollado para su uso en dispositivos. SuperFly tiene 94 millones de parámetros, que Orús compara con el tamaño del cerebro de una mosca. “Esto es como tener una mosca, pero un poco más inteligente”, dijo. SuperFly está diseñado para ser entrenado con datos muy restringidos, como las operaciones de un dispositivo.
Multiverse imagina que se integre en electrodomésticos, permitiendo a los usuarios operarlos con comandos de voz como “iniciar lavado rápido” para una lavadora. Con un poco de potencia de procesamiento (como un Arduino), el modelo puede manejar una interfaz de voz, como mostró la empresa en una demostración en vivo a TechCrunch. El otro modelo se llama ChickBrain y es más grande, con 3.2 mil millones de parámetros, pero también es mucho más capaz y tiene habilidades de razonamiento. Es una versión comprimida del modelo Llama 3.1 8B de Meta, según Multiverse. Sin embargo, es lo suficientemente pequeño como para funcionar en un MacBook, sin necesidad de conexión a Internet. Más importante aún, Orús afirmó que ChickBrain supera ligeramente al original en varias pruebas estándar, incluyendo la evaluación de habilidades lingüísticas MMLU-Pro y las pruebas de habilidades matemáticas Math 500 y GSM8K.
Es importante destacar que Multiverse no afirma que su Zoo de Modelos superará a los modelos más grandes y avanzados en estas pruebas. La idea es que su tecnología puede reducir el tamaño del modelo sin perder rendimiento. Orús mencionó que la empresa ya está en conversaciones con los principales fabricantes de dispositivos y electrodomésticos, incluyendo Apple, Samsung, Sony y HP. La ronda de financiación fue liderada por la firma de capital de riesgo europea Bullhound Capital, con la participación de otros, incluyendo HP Tech Ventures y Toshiba. La startup también ofrece tecnología de compresión para otras formas de aprendizaje automático, como el reconocimiento de imágenes, y en seis años ha conseguido clientes como BASF, Ally, Moody’s y Bosch. Además de vender sus modelos directamente a los principales fabricantes de dispositivos, Multiverse ofrece sus modelos comprimidos a través de una API alojada en AWS que cualquier desarrollador puede utilizar, a menudo con tarifas de token más bajas que las de sus competidores.


