本周早些时候,五位涉及AI供应链各层面的专家在比佛利山庄的米尔肯全球会议上与编辑进行了深入交流,讨论内容涵盖芯片短缺、轨道数据中心,甚至质疑支撑整个技术体系的架构是否存在根本性问题。

与TechCrunch同台的嘉宾包括:ASML首席执行官Christophe Fouquet,该荷兰公司垄断极紫外光刻机的制造,这种设备是现代芯片不可或缺的;Google Cloud首席运营官Francis deSouza,负责公司历史上最大规模的基础设施投资;Applied Intuition联合创始人兼CEO Qasar Younis,这家市值150亿美元的物理AI公司起步于仿真领域,现已进入国防领域;Perplexity首席商务官Dimitry Shevelenko,该公司专注于AI原生的搜索到代理服务;以及量子物理学家Eve Bodnia,她离开学术界,创办Logical Intelligence,挑战AI行业普遍接受的基础架构。(Meta前首席AI科学家Yan LeCun今年早些时候成为该公司技术研究委员会的创始主席。)

以下是五位专家的主要观点:

瓶颈是真实存在的

AI热潮正遭遇严峻的物理限制,而这些限制远比许多人想象的更早出现在供应链底层。Fouquet首先指出,芯片制造正经历“巨大的加速”,但他坚信未来两到五年内市场将持续供应不足,意味着谷歌、微软、亚马逊、Meta等超级云服务商无法获得他们所支付的全部芯片。

DeSouza强调了问题的规模和增长速度,提到Google Cloud上季度收入突破200亿美元,同比增长63%,而其未交付的订单几乎在一个季度内从2500亿美元翻倍至4600亿美元。“需求是真实存在的,”他平静地说道。

Younis则认为瓶颈主要来自数据。Applied Intuition为汽车、卡车、无人机、采矿设备和国防车辆构建自动驾驶系统,而其限制不是硅芯片,而是必须通过机器进入现实世界并观察结果才能收集的数据。“你必须从现实世界中获取数据,”他说,没有任何合成仿真能够完全弥补这一差距。“要完全通过合成方式训练运行于物理世界的模型,还需要很长时间。”

能源问题同样严峻

如果芯片是首个瓶颈,能源则是紧随其后的挑战。DeSouza确认谷歌正在认真探索轨道数据中心,以应对能源限制。“你可以获得更丰富的能源,”他说。当然,即使在轨道上也不简单。空间是真空,消除了对流,散热只能通过辐射完成,这比目前数据中心依赖的空气和液体冷却系统更慢且更难设计。但公司仍将其视为一条可行路径。

DeSouza进一步强调了通过整合提升效率的重要性。谷歌从定制TPU芯片到模型和代理的全栈协同设计,在每瓦特计算能力上获得了显著优势,这是购买现成组件的公司无法复制的。“在TPU上运行Gemini比任何其他配置都更节能,”因为芯片设计师在模型发布前就已了解其需求。

Fouquet也表达了类似观点:“没有什么是无价的。”当前行业正处于一个奇特阶段,投入巨额资本,出于战略必要。但更多计算意味着更多能源消耗,而能源是有成本的。

不同类型的智能

当行业其他部分仍在围绕大语言模型的规模、架构和推理效率展开讨论时,Bodnia正在打造截然不同的AI。

她的公司Logical Intelligence基于所谓的能量模型(EBM),这类AI不预测序列中的下一个词,而是试图理解数据背后的规则,她认为这更接近人脑的工作方式。“语言是我脑与您脑之间的用户界面,”她说,“推理本身并不依赖于任何语言。”

她最大的模型拥有2亿参数——相比领先的大型语言模型的数百亿参数要小得多——但运行速度快数千倍。更重要的是,它设计成能随着数据变化实时更新知识,而无需从头再训练。

在芯片设计、机器人等需要理解物理规则而非语言模式的领域,她认为EBM更为自然。“开车时,你不是在寻找任何语言中的模式,而是观察周围环境,理解世界规则,然后做出决策。”这一观点颇具吸引力,随着AI领域开始质疑单靠规模是否足够,这种思路未来可能获得更多关注。

代理、护栏与信任

Shevelenko详细介绍了Perplexity如何从搜索产品演变为“数字员工”。其最新产品Perplexity Computer并非知识工作者使用的工具,而是由知识工作者指挥的团队。“每天醒来,你的团队有一百名员工,”他说,“你会如何最大化利用他们?”

这一设想引发了对控制权的关注,我提出了相关问题。他的回答是:细粒度控制。企业管理员不仅可以指定代理访问哪些连接器和工具,还能决定权限是只读还是读写——这在代理操作企业系统时至关重要。当Perplexity的计算机代理Comet代表用户执行操作时,会先提出计划并请求批准。虽然部分用户觉得这种摩擦令人烦恼,但他认为这是必要的,尤其是在加入Lazard董事会后,他对保护拥有180年历史、完全基于客户信任的品牌的首席信息安全官的保守本能产生了共鸣。“细粒度是良好安全习惯的基石。”

主权,而非仅仅是安全

Younis提出了小组中最具地缘政治色彩的观点:物理AI与国家主权紧密相连,这是纯数字AI所不具备的。

互联网最初作为美国技术传播,抵制主要发生在应用层——如Uber和DoorDash——当线下后果显现时。物理AI则不同。自动驾驶汽车、国防无人机、采矿设备、农业机械等在现实世界中的表现不可忽视,政府必须面对安全、数据收集及谁控制境内系统的问题。“几乎每个国家都表示:我们不希望这种物理形态的智能由他国控制。”他告诉观众,目前拥有机器人出租车的国家比拥有核武器的国家还少。

Fouquet则从另一个角度阐述。中国的AI进展确实显著——今年早些时候DeepSeek的发布在行业内引发了近乎恐慌——但这种进展受限于模型层以下。没有极紫外光刻技术,中国芯片制造商无法生产最先进的半导体,基于旧硬件的模型无论软件多么先进,都会处于复合劣势。“今天,美国拥有数据、计算资源、芯片和人才。中国在顶层做得很好,但在底层某些环节仍有不足。”

关于下一代的思考能力

在小组讨论接近尾声时,有观众提出了一个明显且令人不安的问题:这一切是否会影响下一代的批判性思维能力?

答案较为乐观,毕竟这些专家的职业生涯都与这项技术紧密相关。DeSouza立刻指出,更强大的工具可能让人类最终解决规模更大的问题,比如尚未理解的神经系统疾病、生物温室气体清除以及被推迟多年的电网基础设施。“这将释放我们进入下一个创造力层次。”

Shevelenko则更务实:入门级工作可能消失,但独立创业的门槛从未如此低。“对于拥有Perplexity Computer的任何人来说,限制是你自己的好奇心和主动性。”

Younis则明确区分了知识工作与体力劳动。他指出,美国农民的平均年龄为58岁,采矿、长途运输和农业领域的劳动力短缺问题长期存在且日益严重——这并非因为工资低,而是因为没人愿意做这些工作。在这些领域,物理AI并非取代愿意工作的员工,而是在填补一个已存在且将持续扩大的空缺。