Bhavish Aggarwal, fundador de Ola, está invirtiendo 230 millones de dólares en una startup de inteligencia artificial que él mismo fundó, llamada Krutrim. Esta inversión se da en un momento en que India busca posicionarse en un campo donde predominan empresas de Estados Unidos y China. Según una fuente cercana al asunto, Aggarwal está financiando principalmente esta inversión a través de su oficina familiar.
En una publicación en X, Aggarwal mencionó que Krutrim tiene como objetivo atraer una inversión total de 1.15 mil millones de dólares para el próximo año. El resto del capital se buscará de inversores externos. Este anuncio de financiamiento coincide con el hecho de que Krutrim ha hecho que sus modelos de inteligencia artificial sean de código abierto y ha revelado planes para construir lo que afirma será la supercomputadora más grande de India, en colaboración con Nvidia.
Krutrim ha lanzado Krutrim-2, un modelo de lenguaje con 12 mil millones de parámetros, que ha demostrado un buen rendimiento en el procesamiento de idiomas indios. En pruebas de análisis de sentimientos, Krutrim obtuvo una puntuación de 0.95, en comparación con 0.70 de modelos competidores, y alcanzó un 80% de éxito en tareas de generación de código. Además, el laboratorio ha hecho de código abierto varios modelos especializados, incluyendo sistemas para procesar imágenes, traducción de voz y búsqueda de texto, todos optimizados para idiomas indios.
Aggarwal comentó que aunque aún no están cerca de los estándares globales, han logrado un buen progreso en un año. Al hacer que sus modelos sean de código abierto, esperan que toda la comunidad de inteligencia artificial en India colabore para crear un ecosistema de IA de clase mundial.
Esta iniciativa se produce mientras India busca establecerse en un paisaje de inteligencia artificial dominado por empresas de EE. UU. y China. La semana pasada, India elogió el progreso de DeepSeek, una startup que lanzó un modelo de razonamiento con un presupuesto modesto, y anunció que albergará los modelos de lenguaje de este laboratorio chino en servidores nacionales. La división en la nube de Krutrim comenzó a ofrecer DeepSeek en servidores indios la semana pasada.
Krutrim también ha desarrollado su propio marco de evaluación, llamado BharatBench, para medir la competencia de los modelos de IA en idiomas indios, abordando una brecha en los estándares existentes que se centran principalmente en inglés y chino. Su enfoque técnico incluye el uso de una ventana de contexto de 128,000 tokens, lo que permite a sus sistemas manejar textos más largos y conversaciones más complejas. Los métricas de rendimiento publicadas por la startup mostraron que Krutrim-2 logró altas puntuaciones en corrección gramatical (0.98) y en conversaciones de múltiples turnos (0.91).
Esta inversión sigue al lanzamiento en enero de Krutrim-1, un sistema de 7 mil millones de parámetros que fue el primer modelo de lenguaje grande de India. La implementación de la supercomputadora con Nvidia está programada para activarse en marzo, con planes de expansión a lo largo del año.


