Las grandes empresas tecnológicas suelen presumir de modelos de inteligencia artificial con billones de parámetros que requieren costosos y enormes grupos de GPUs. Sin embargo, Fastino, una startup de Palo Alto, está tomando un enfoque diferente. Afirma haber inventado una nueva arquitectura de modelo de IA que es intencionalmente pequeña y específica para tareas. Según Fastino, estos modelos son tan pequeños que se entrenan con GPUs de juegos de gama baja, cuyo costo total es inferior a $100,000. Este método ha llamado la atención, y Fastino ha conseguido $17.5 millones en financiación inicial, liderada por Khosla Ventures, que fue el primer inversor de OpenAI. Esto eleva la financiación total de la startup a casi $25 millones, después de haber recaudado $7 millones en noviembre pasado en una ronda previa liderada por M12, el brazo de capital de riesgo de Microsoft, y Insight Partners.
Ash Lewis, CEO y cofundador de Fastino, afirma: “Nuestros modelos son más rápidos, más precisos y cuestan una fracción para entrenar, superando a los modelos más destacados en tareas específicas”. Fastino ha desarrollado un conjunto de pequeños modelos que vende a clientes empresariales, cada uno enfocado en una tarea específica que una empresa podría necesitar, como redactar datos sensibles o resumir documentos corporativos. Aunque Fastino no ha revelado métricas o usuarios iniciales, asegura que su rendimiento ha impresionado a los primeros usuarios. Por ejemplo, debido a su tamaño, sus modelos pueden ofrecer una respuesta completa en un solo token, mostrando la tecnología capaz de dar una respuesta detallada en milisegundos.
Aún es pronto para saber si el enfoque de Fastino tendrá éxito. El espacio de IA empresarial está saturado, con empresas como Cohere y Databricks también destacando en tareas específicas. Además, los fabricantes de modelos SATA enfocados en empresas, como Anthropic y Mistral, también ofrecen modelos pequeños. No es un secreto que el futuro de la IA generativa para empresas probablemente esté en modelos de lenguaje más pequeños y enfocados. El tiempo lo dirá, pero el apoyo temprano de Khosla ciertamente es un buen augurio. Por ahora, Fastino se centra en construir un equipo de IA de vanguardia, buscando investigadores en los mejores laboratorios de IA que no estén obsesionados con crear el modelo más grande o superar los estándares. “Nuestra estrategia de contratación se enfoca en investigadores que tal vez tengan un proceso de pensamiento contrario a cómo se están construyendo actualmente los modelos de lenguaje”, dice Lewis.


