Cada vez que le haces una pregunta a ChatGPT, tu solicitud desencadena una carrera de retransmisión de datos. La información sale de la memoria, pasa a través de una CPU para su preprocesamiento, viaja a una GPU para realizar cálculos pesados y luego regresa, y todo ese viaje se repite para cada palabra que genera la IA.
El cuello de botella es estructural: significa pasar por algunos de los chips más caros y que consumen más energía de la industria en cada solicitud. Esa ineficiencia es exactamente lo que XCENA, una startup con oficinas en Corea del Sur y Estados Unidos, está tratando de resolver. La startup de cuatro años ha diseñado un chip que acerca las capacidades informáticas a la DRAM (los chips de memoria rápidos y de corto plazo que almacenan datos que un procesador está utilizando activamente) permitiendo que las operaciones de datos de rutina se manejen cerca de la memoria, sin los costosos viajes de ida y vuelta entre CPU, GPU y memoria.
Si funciona a escala, las implicaciones para los costos de infraestructura de IA podrían ser significativas, lo que explica en gran medida el entusiasmo de los inversores en todo el país. De hecho, XCENA acaba de recaudar 135 millones de dólares en una Serie B con una valoración de 570 millones de dólares, lo que eleva el total recaudado a 185 millones de dólares.
El director ejecutivo de XCENA, Jin Kim, cofundó la startup en 2022 junto con el CTO Dohun Kim y el CPO Harry Juhyun Kim, todos veteranos de Samsung y SK Hynix, los gigantes de la memoria que suministran chips que alimentan las GPU de Nvidia. «Tanto las CPU como las GPU se han vuelto más inteligentes a lo largo de las décadas. La memoria nunca lo hizo. XCENA quiere cambiar eso», dijo Kim en una entrevista con TechCrunch. «El reciente aumento de los precios de las memorias y las acciones relacionadas apunta a un cambio más amplio en la infraestructura de IA hacia arquitecturas centradas en la memoria», añadió. (Este mes, las tres empresas que dominan el mercado mundial de chips de memoria (Samsung, SK Hynix y Micron) superaron cada una una valoración de un billón de dólares por primera vez).
XCENA está apostando su negocio a la tesis de que «la inferencia no es sólo un problema de computación; es cada vez más un problema de escalamiento de la memoria», dijo Kim.
El chip de XCENA, el MX1, se conecta a la CPU a través de CXL (Compute Express Link), esencialmente una vía rápida dedicada entre el procesador y la memoria, que procesa datos antes de que necesiten salir del módulo de memoria. Aporta computación a los datos, y no al revés. La compañía afirma que lo que antes requería 10 servidores podría funcionar en solo uno.
“Si bien las GPU se destacan en la multiplicación de matrices (la pesada matemática detrás del entrenamiento de modelos de IA), gran parte de la orquestación de datos circundante, incluido el preprocesamiento y la gestión de caché KV. [the system that stores prior conversation context so a model doesn’t have to reprocess it]y almacenamiento en caché de datos, todavía se ejecuta en CPU. Nuestro chip maneja esas tareas directamente dentro del propio módulo de memoria”, dijo Kim.
La demanda de soluciones de memoria ha aumentado desde la segunda mitad del año pasado y la compañía cree que el momento está jugando a su favor.
Las conversaciones con varios proveedores globales de memoria se encuentran en sus primeras etapas, aunque Kim se negó a nombrarlos. Los clientes ideales de la empresa son los hiperescaladores que gastan decenas de miles de millones al año en infraestructura de IA, donde incluso una pequeña ganancia en la eficiencia de la memoria puede significar cientos de millones en ahorros.
El MX1 sigue siendo un prototipo. Está previsto que los chips de producción en masa salgan de las líneas de fundición de Samsung a finales de 2026, y la empresa espera generar ingresos a partir de 2027.
Mientras que los fabricantes de unidades de procesamiento neuronal (NPU) compiten para desafiar a Nvidia en cargas de trabajo de entrenamiento, XCENA apunta a la capa de memoria intensiva que se encuentra debajo de todo ello.
Los rivales más cercanos de XCENA incluyen Astera Labs y Marvell, ambas empresas que cotizan en Nasdaq y que trabajan en conectividad de memoria de próxima generación. Marvell es un actor importante y establecido que ya trabaja en el mismo espacio, dijo Kim, y agregó que el diferenciador se reduce a la propiedad intelectual. «Tenemos miles de núcleos», dijo Kim. Basado en especificaciones públicas, el enfoque de Marvell se basa en un puñado de núcleos de uso general en comparación.
Esos núcleos están construidos sobre RISC-V, un modelo de diseño de chip de código abierto, y optimizados específicamente para el procesamiento de datos., con cada núcleo deliberadamente mantenido pequeño y eficiente. Más allá de los propios núcleos, XCENA diseña su propia jerarquía de memoria interna, bus de interconexión y controlador DRAM, un nivel de integración vertical que la mayoría de las empresas de chips, incluidos sus rivales más grandes, suelen subcontratar.
Las empresas de capital de riesgo con sede en Seúl Altinum e IMM Investment codirigieron la ronda Serie B, junto con Corstone Asia y los inversores existentes SBI Investment y Mirae Asset Capital. La compañía, que cuenta con más de 90 empleados en oficinas en Pangyo, un centro tecnológico en las afueras de Seúl, y en Sunnyvale, también está en conversaciones con inversores internacionales sobre financiación adicional.
Cuando compra a través de enlaces en nuestros artículos, podemos ganar una pequeña comisión. Esto no afecta nuestra independencia editorial.



