现代人工智能主要依赖于英伟达(Nvidia)的设计,这一格局使得英伟达的市值突破了4万亿美元大关。每一代英伟达芯片的推出,都让企业能够利用数百甚至数千个处理器组成的庞大数据中心,训练更强大的AI模型。英伟达成功的一个关键因素是它提供了配套的软件,帮助开发者为每一代芯片编写程序。不过,这项技能未来可能不再是独一无二的优势。
一家名为Wafer的初创公司正在训练AI模型,承担AI领域中最复杂且关键的任务之一——优化代码,使其能在特定的硅芯片上高效运行。
Wafer的联合创始人兼CEO Emilio Andere表示,公司通过强化学习对开源模型进行训练,教它们编写内核代码,即直接与操作系统硬件交互的软件。Wafer还为现有的代码生成模型(如Anthropic的Claude和OpenAI的GPT)添加了“智能代理”功能,增强它们编写能直接运行在芯片上的代码的能力。
如今,许多知名科技公司都拥有自己的芯片。苹果等公司多年来一直使用定制硅片来提升笔记本、平板和智能手机软件的性能和效率。谷歌和亚马逊等巨头则打造自有芯片,以提升云计算平台的性能。Meta最近宣布将部署1吉瓦计算能力,采用与博通合作开发的新芯片。定制芯片的部署同样需要大量代码编写,确保软件能在新处理器上平稳高效运行。
Wafer正与AMD、亚马逊等公司合作,帮助优化软件以适配其硬件。迄今为止,该初创公司已获得谷歌的Jeff Dean、OpenAI的Wojciech Zaremba等人的400万美元种子轮投资。
Andere认为,Wafer基于AI的优化方法有望挑战英伟达的市场主导地位。许多高端芯片在浮点运算性能(衡量芯片执行简单计算能力的关键指标)上已与英伟达顶级芯片不相上下。
“最好的AMD硬件、亚马逊的Trainium芯片、谷歌的TPU,都能提供与英伟达GPU相当的理论浮点运算性能,”Andere说,“我们的目标是最大化每瓦特的智能表现。”
Andere指出,能够优化代码以确保芯片高效稳定运行的性能工程师非常稀缺且需求旺盛,而英伟达的软件生态系统则让为其芯片编写和维护代码变得更容易,这也使得即便是最大的科技公司也难以独自应对挑战。
例如,Anthropic与亚马逊合作在Trainium芯片上构建AI模型时,就不得不从零开始重写模型代码,以实现最佳性能。
当然,Anthropic的Claude如今已是众多超越人类水平的代码生成AI模型之一。Andere预计,AI很快就会开始蚕食英伟达的软件优势。
“护城河存在于芯片的可编程性中,”Andere谈及英伟达的软件库和工具时说,“我认为现在是时候重新思考这是否真的是一道坚固的护城河了。”

除了让代码优化更简单,AI未来或将简化芯片设计过程。由两位前谷歌工程师Azalia Mirhoseini和Anna Goldie创立的初创公司Ricursive Intelligence,正在开发利用AI设计芯片的新方法。如果这项技术成功,更多公司将能涉足芯片设计,打造更适合自身软件的定制硅片。
Mirhoseini同时也是斯坦福大学助理教授,她表示:“我们专注于芯片设计中的两大难点——物理设计和设计验证。”
芯片设计是全球最复杂且影响深远的工作之一。芯片工程师需要合理布局硅片上的众多组件,以优化不同功能。芯片设计完成后,还需经过反复测试和验证,才能送往代工厂生产。
英伟达的设计对现代AI至关重要,每一代芯片都让企业能够利用成百上千的处理器,在庞大数据中心中训练更强大的AI模型。
Mirhoseini和Goldie在谷歌时开发了一种AI优化芯片关键组件布局的方法,这一方法彻底改变了谷歌自有处理器的设计流程,并已被业界广泛采用。
Ricursive的目标是更进一步,自动化更多芯片设计环节,并将大型语言模型整合进设计流程,使工程师能够用自然语言描述芯片变更或提出问题。就像用代码开发应用一样,未来或许可以用“语言”设计芯片。
Ricursive仍在完善技术,但Mirhoseini表示,公司已证明能够优化更多芯片设计环节。
自动化芯片设计的前景令投资者兴奋不已:Ricursive在短短几个月内筹集了3.35亿美元,估值达40亿美元。
Goldie认为,未来AI甚至可能共同设计芯片和算法,使其更加强大。AI调整自身硅片和代码的能力,或将形成一种递归式的自我提升。“我们正进入一个新阶段,可以投入更多计算资源,设计更快更好的芯片——为芯片设计创造一种规模定律。”
你如何看待AI设计自己的硅芯片?欢迎留言或发送邮件至ailab@wired.com分享你的看法。
这是Will Knight的AI Lab通讯的一期内容。你可以在这里阅读往期通讯。


