每当你向ChatGPT提问时,都会触发一场数据接力赛。信息从内存中传出,经过CPU进行预处理,再传到GPU进行大量计算,最后再返回内存——而这整个过程会为AI生成的每一个单词重复一次。
这一瓶颈是结构性的——意味着每次请求都必须经过业内最昂贵且耗电的芯片。这种低效正是拥有韩国和美国办公室的初创公司XCENA试图解决的问题。这家成立四年的公司设计了一款芯片,将计算能力更靠近DRAM——即存储处理器正在使用数据的高速短期内存芯片,使得常规数据操作可以在内存附近完成,无需频繁往返于CPU、GPU和内存之间的高成本传输。
如果这一技术能大规模应用,将对AI基础设施成本产生重大影响,这也是投资者对该公司的热情所在。XCENA刚刚完成了1.35亿美元的B轮融资,估值达5.7亿美元,累计融资总额达到1.85亿美元。
XCENA的CEO金镇(Jin Kim)与CTO Dohun Kim和CPO Harry Juhyun Kim于2022年共同创立了这家公司,他们均来自三星和SK海力士这两家为Nvidia GPU提供芯片的内存巨头。“几十年来,CPU和GPU都变得更智能了,但内存却没有。XCENA希望改变这一点,”金镇在接受TechCrunch采访时表示。“近期内存价格和相关股票的上涨,反映了AI基础设施向以内存为中心架构的更广泛转变。”(本月,全球内存芯片市场的三大巨头——三星、SK海力士和美光——首次市值均突破万亿美元。)
金镇表示,XCENA的商业理念是“推理不仅是计算问题,更是内存扩展问题”。
XCENA的芯片MX1通过CXL(计算快速互联)连接CPU,这是一条处理器与内存之间的专用高速通道,在数据离开内存模块之前就进行处理。它实现了计算靠近数据,而非数据靠近计算。公司声称,过去需要10台服务器的任务,现在可能只需一台即可完成。
“虽然GPU擅长矩阵乘法——AI模型训练背后的核心数学运算,但大量周边数据协调工作,包括预处理、KV缓存管理(存储先前对话上下文,避免模型重复处理)和数据缓存,仍由CPU完成。我们的芯片直接在内存模块内处理这些任务,”金镇说。

自去年下半年以来,内存解决方案的需求激增,公司认为时机正好有利于他们。
公司正与多家全球内存供应商进行初步接触,但金镇未透露具体名称。理想客户是那些每年在AI基础设施上投入数百亿美元的超大规模云服务商,在他们那里,即使是内存效率的微小提升,也能带来数亿美元的节省。
MX1目前仍处于原型阶段,计划于2026年底由三星代工厂实现量产,预计2027年开始产生收入。
尽管神经处理单元(NPU)制造商正竞相挑战Nvidia在训练工作负载上的地位,XCENA则专注于位于其下方的内存密集层。
XCENA的主要竞争对手包括纳斯达克上市的Astera Labs和Marvell,这两家公司都在开发下一代内存连接技术。金镇表示,Marvell是该领域的成熟大厂,差异化主要体现在知识产权上。“我们拥有数千个核心,”他说。相比之下,Marvell依赖的是少量通用核心。
这些核心基于开源芯片设计蓝图RISC-V,专门针对数据处理进行了优化,每个核心都被设计得小巧且高效。除了核心,XCENA还自主设计了内部内存层次结构、互联总线和DRAM控制器——这种垂直整合程度是大多数芯片公司,包括更大竞争对手通常会外包的。
此次B轮融资由首尔的Atinum和IMM Investment联合领投,Corstone Asia以及现有投资者SBI Investment和未来资产资本也参与其中。公司在板桥(首尔附近的科技园区)和美国桑尼维尔设有办公室,员工超过90人,并正与国际投资者洽谈额外融资。


