谷歌云于周三宣布,其第八代定制AI芯片——张量处理单元(TPU)将分为两款产品:一款名为TPU 8t,专注于模型训练;另一款TPU 8i则针对推理任务。
推理指的是模型在用户提交提示后持续运行的过程。
谷歌表示,这两款新TPU相比前代产品性能大幅提升:AI模型训练速度提升至3倍,性能成本比提升80%,且支持超过100万个TPU在单一集群中协同工作。这样的设计意味着客户能够以更低的能耗和成本获得更强大的计算能力。谷歌将其芯片称为TPU而非GPU,是因为其定制的低功耗芯片最初命名为Tensor。
不过,谷歌的芯片目前还未全面挑战英伟达的市场地位。与微软和亚马逊等大型云服务商类似,谷歌目前将这些芯片作为补充,配合其基于英伟达系统的基础设施使用,并未完全取代英伟达。事实上,谷歌承诺将在今年晚些时候提供英伟达最新芯片Vera Rubin。

未来,随着亚马逊、微软和谷歌等超大规模云服务商不断开发自有AI芯片,企业将逐渐将AI工作负载迁移至云端并适配这些芯片,可能会减少对英伟达的依赖。
但目前来看,押注英伟达依然是明智之举。著名芯片市场分析师Patrick Moorhead曾在2016年谷歌推出首款TPU时戏言,这可能对英伟达和英特尔构成威胁,但英伟达如今市值近5万亿美元,证明当时的预测并未成真。
如果英伟达的战略顺利,谷歌作为AI云服务提供商的成长反而会带来更多业务机会,即使部分工作负载运行在谷歌自家的芯片上。
此外,谷歌还透露已与英伟达达成合作,共同优化计算机网络技术,提升基于英伟达系统的云端运行效率。两家公司正致力于强化名为Falcon的软件网络技术,该技术由谷歌于2023年开发并开源,隶属于开源数据中心硬件组织Open Compute Project。
