这家芯片初创公司筹资1.35亿美元，押注AI最大瓶颈不是计算能力，而是内存

每当你向ChatGPT提问时，都会触发一场数据接力赛。信息从内存中传出，经过CPU进行预处理，再传到GPU进行大量计算，最后再返回内存——而这整个过程会为AI生成的每一个单词重复一次。

这一瓶颈是结构性的——意味着每次请求都必须经过业内最昂贵且耗电的芯片。这种低效正是拥有韩国和美国办公室的初创公司XCENA试图解决的问题。这家成立四年的公司设计了一款芯片，将计算能力更靠近DRAM——即存储处理器正在使用数据的高速短期内存芯片，使得常规数据操作可以在内存附近完成，无需频繁往返于CPU、GPU和内存之间的高成本传输。

如果这一技术能大规模应用，将对AI基础设施成本产生重大影响，这也是投资者对该公司的热情所在。XCENA刚刚完成了1.35亿美元的B轮融资，估值达5.7亿美元，累计融资总额达到1.85亿美元。

XCENA的CEO金镇（Jin Kim）与CTO Dohun Kim和CPO Harry Juhyun Kim于2022年共同创立了这家公司，他们均来自三星和SK海力士这两家为Nvidia GPU提供芯片的内存巨头。“几十年来，CPU和GPU都变得更智能了，但内存却没有。XCENA希望改变这一点，”金镇在接受TechCrunch采访时表示。“近期内存价格和相关股票的上涨，反映了AI基础设施向以内存为中心架构的更广泛转变。”（本月，全球内存芯片市场的三大巨头——三星、SK海力士和美光——首次市值均突破万亿美元。）

金镇表示，XCENA的商业理念是“推理不仅是计算问题，更是内存扩展问题”。

XCENA的芯片MX1通过CXL（计算快速互联）连接CPU，这是一条处理器与内存之间的专用高速通道，在数据离开内存模块之前就进行处理。它实现了计算靠近数据，而非数据靠近计算。公司声称，过去需要10台服务器的任务，现在可能只需一台即可完成。

“虽然GPU擅长矩阵乘法——AI模型训练背后的核心数学运算，但大量周边数据协调工作，包括预处理、KV缓存管理（存储先前对话上下文，避免模型重复处理）和数据缓存，仍由CPU完成。我们的芯片直接在内存模块内处理这些任务，”金镇说。

自去年下半年以来，内存解决方案的需求激增，公司认为时机正好有利于他们。

公司正与多家全球内存供应商进行初步接触，但金镇未透露具体名称。理想客户是那些每年在AI基础设施上投入数百亿美元的超大规模云服务商，在他们那里，即使是内存效率的微小提升，也能带来数亿美元的节省。

MX1目前仍处于原型阶段，计划于2026年底由三星代工厂实现量产，预计2027年开始产生收入。

尽管神经处理单元（NPU）制造商正竞相挑战Nvidia在训练工作负载上的地位，XCENA则专注于位于其下方的内存密集层。

XCENA的主要竞争对手包括纳斯达克上市的Astera Labs和Marvell，这两家公司都在开发下一代内存连接技术。金镇表示，Marvell是该领域的成熟大厂，差异化主要体现在知识产权上。“我们拥有数千个核心，”他说。相比之下，Marvell依赖的是少量通用核心。

这些核心基于开源芯片设计蓝图RISC-V，专门针对数据处理进行了优化，每个核心都被设计得小巧且高效。除了核心，XCENA还自主设计了内部内存层次结构、互联总线和DRAM控制器——这种垂直整合程度是大多数芯片公司，包括更大竞争对手通常会外包的。

此次B轮融资由首尔的Atinum和IMM Investment联合领投，Corstone Asia以及现有投资者SBI Investment和未来资产资本也参与其中。公司在板桥（首尔附近的科技园区）和美国桑尼维尔设有办公室，员工超过90人，并正与国际投资者洽谈额外融资。

这家芯片初创公司筹资1.35亿美元，押注AI最大瓶颈不是计算能力，而是内存

标签

评论

相关阅读

72.3%的教师认为“擅长设计提示词的学生学习更深入”——日本アルサーガパートナーズ调查

Grok新增“Build Mode”，仅凭创意即可制作游戏和应用

Siri AI或将为高级用户设立付费墙