RadixArk, una joven startup surgida del proyecto de código abierto SGLang en el laboratorio de Ion Stoica en la Universidad de California, Berkeley, se ha convertido en uno de los nuevos nombres fuertes en la llamada “capa de inferencia” de la inteligencia artificial. Parte del equipo que mantenía SGLang —herramienta usada por empresas como xAI y Cursor para acelerar el funcionamiento de modelos de IA— se ha trasladado a RadixArk, fundada en 2023 y valorada recientemente en unos 400 millones de dólares en una ronda liderada por Accel, según fuentes citadas por TechCrunch.
La compañía está liderada por Ying Sheng, exingeniera de xAI y antigua científica de datos en Databricks, quien dejó la empresa de Elon Musk para convertirse en cofundadora y CEO de RadixArk. Entre sus primeros apoyos figuran inversores de peso como Lip-Bu Tan, CEO de Intel, aunque ni Sheng ni los fondos implicados han querido hacer comentarios.
Tanto SGLang como RadixArk se centran en optimizar la inferencia: hacer que los modelos de IA funcionen más rápido y con menos coste en el mismo hardware. Esta fase, junto con el entrenamiento, concentra gran parte del gasto en servidores de los servicios de IA, por lo que cualquier mejora de eficiencia puede traducirse en ahorros significativos para grandes plataformas tecnológicas.
El fenómeno no es aislado. vLLM, otro proyecto de inferencia nacido también en el laboratorio de Ion Stoica, ha seguido una trayectoria similar, transformándose en startup y negociando una gran ronda de financiación que, según Forbes, podría superar los 160 millones de dólares a una valoración próxima a los 1.000 millones. Fuentes indican que Andreessen Horowitz lideraría la inversión, aunque ni el fondo ni los fundadores han confirmado las cifras y han cuestionado parte de la información publicada.
RadixArk mantiene SGLang como motor de modelos de IA de código abierto, a la vez que desarrolla Miles, un marco especializado en aprendizaje por refuerzo pensado para que las empresas entrenen modelos que mejoren de forma continua. Aunque la mayor parte de sus herramientas sigue siendo gratuita, la startup ha empezado a cobrar por servicios de alojamiento, señal de un giro hacia un modelo de negocio más definido.
El interés de los inversores por la infraestructura de inferencia se está disparando. Baseten, otro proveedor del sector, recaudó recientemente 300 millones de dólares a una valoración de 5.000 millones, y Fireworks AI levantó 250 millones a una valoración de 4.000 millones el pasado octubre. Estas operaciones apuntan a que, más allá de los grandes modelos de IA, la batalla clave se libra en la capa que permite ejecutarlos de forma rápida, barata y escalable.


