Cada vez que un usuario hace una pregunta a ChatGPT u otra IA generativa, los datos recorren un camino complejo: salen de la memoria, pasan por la CPU para tareas previas, viajan a la GPU para los cálculos pesados y vuelven a la memoria. Este ir y venir se repite por cada palabra generada y obliga a usar constantemente los chips más caros y que más energía consumen.
La startup XCENA, con oficinas en Corea del Sur y Estados Unidos, quiere romper ese cuello de botella con un nuevo tipo de chip que acerca la capacidad de cómputo directamente a la memoria DRAM, donde se guardan los datos que el procesador está usando en ese momento. Así, muchas operaciones rutinarias se pueden ejecutar “junto” a la memoria, sin viajes continuos entre CPU, GPU y módulos de memoria.
La compañía acaba de cerrar una ronda Serie B de 135 millones de dólares que la valora en 570 millones, y eleva su financiación total a 185 millones. Fundada en 2022 por Jin Kim (CEO), Dohun Kim (CTO) y Harry Juhyun Kim (CPO), exdirectivos de Samsung y SK Hynix, XCENA se apoya en la tesis de que la inferencia de modelos de IA ya no es solo un problema de capacidad de cómputo, sino cada vez más un problema de escalado de memoria.
Su chip MX1 se conecta a la CPU mediante CXL (Compute Express Link), una vía rápida especializada entre procesador y memoria. De este modo, procesa los datos dentro del propio módulo de memoria y “lleva el cómputo a los datos, en lugar de mover los datos al cómputo”. Según la empresa, cargas de trabajo que antes requerían diez servidores podrían ejecutarse en uno solo.
Mientras las GPUs siguen centradas en el entrenamiento y las operaciones de multiplicación de matrices, MX1 está diseñado para manejar cerca de la memoria tareas como el preprocesamiento, la gestión de la caché KV (que conserva el contexto de conversaciones anteriores) y otras formas de orquestación de datos que hoy recaen en la CPU.
El chip aún está en fase de prototipo. XCENA prevé que la producción en volumen arranque en las fábricas de Samsung a finales de 2026 y que los primeros ingresos lleguen en 2027. Sus clientes objetivo son los grandes proveedores de nube e hiperescaladores que invierten decenas de miles de millones anuales en infraestructura de IA, para quienes pequeñas mejoras en eficiencia de memoria pueden traducirse en ahorros de cientos de millones.
XCENA compite en un segmento muy codiciado. Empresas como Astera Labs y Marvell, ya cotizadas en Nasdaq, también desarrollan soluciones avanzadas de conectividad de memoria. XCENA afirma diferenciarse por su propiedad intelectual: su diseño integra miles de núcleos RISC‑V especializados y eficientes para procesamiento de datos, además de una jerarquía de memoria interna, bus de interconexión y controlador de DRAM propios, un nivel de integración vertical poco habitual incluso entre fabricantes más grandes.
El momento del mercado parece favorable: la demanda de soluciones de memoria para IA se ha disparado desde la segunda mitad del año pasado, en paralelo al auge de los gigantes de memoria como Samsung, SK Hynix y Micron, que han alcanzado valoraciones del orden del billón de dólares. La Serie B fue liderada por los fondos surcoreanos Altinum e IMM Investment, con participación de Corstone Asia y los inversores existentes SBI Investment y Mirae Asset Capital. XCENA, con más de 90 empleados entre Pangyo (cerca de Seúl) y Sunnyvale (EE. UU.), también negocia nuevas inversiones con actores internacionales.


