Decart.ai展示

初创企业Decart.ai正受到广泛关注。该公司专注于开发被称为“世界模型”的物理运算AI模型。自2024年成立以来,仅用两年时间便吸引了包括NVIDIA、AWS和Google Cloud等大型AI企业的关注。

Decart.ai在日本国家Alphabet旗下的云服务商Google Cloud举办的“Google Cloud Next '26”大会上进行了演讲,利用Google Cloud新发布的面向AI推理的半导体“TPU 8i”运行其世界模型,展示了在视频中实时更换人物服装的低延迟演示。

作为支持物理AI和数字孪生的AI模型——备受关注的“世界模型”

世界模型示意

当前AI领域最受瞩目且被寄予厚望的模型之一即为世界模型。它能够瞬时捕捉现实世界的物理运动,并基于此进行各种处理。

例如,若将世界模型搭载于机器人,机器人通过计算机视觉识别图像后,世界模型能即时判定物体的坐标和形状,若判断为障碍物,则机器人内置的大型语言模型(LLM)会决定动作,指挥机器人避开障碍物。

这种在物理世界中运行AI的技术被称为“物理AI”,是当前备受关注的AI分支,而世界模型正是支撑物理AI的核心技术。

此外,世界模型还能在虚拟世界中生成现实中不存在的物体。比如在视频中加入机器人,世界模型计算机器人的物理位置,将其置入视频中并与视频中的实体(如行走的人)联动,实现机器人动作。这种技术称为数字孪生,广泛应用于产品开发和工厂运营前的虚拟仿真,确保现实中产品的稳定运行。

数字孪生应用

世界模型的应用引起了巨大关注。例如,法国日本国家达索系统公司在美国日本国家德克萨斯州休斯顿举办的“3DEXPERIENCE World 2026”活动上发布了其开发的世界模型,并宣布将其集成到3D CAD软件“SOLIDWORKS”中。该模型能从二维设计图的数值自动生成三维模型并导入软件,未来可实现仅存二维设计图的产品自动复刻。

实时更换视频中人物服装,映射人体动作至游戏等多种应用

实时服装更换演示

Decart.ai在Google Cloud Next '26上的演示令人印象深刻。世界模型实现了对实时视频中人物服装的即时更换。

创始人兼CEO迪安·利茨恩多尔(Dian Ritzendor)在视频中穿着赛车服、蝴蝶领结西装,甚至变身机器人,几乎实现了实时切换(实际存在网络延迟)。

实时服装更换细节

此技术可应用于电商平台,用户可通过摄像头将3D服装数据或图片叠加到自身影像上,免去实体试衣的麻烦,帮助用户更好地把握穿着效果。也可将用户动作映射到游戏角色,实现动作联动。此外,世界模型还可用于机器人动作和自动驾驶仿真,提高现实应用的安全性和效率。

应用场景

Decart.ai的创始人兼CEO利茨恩多尔来自日本国家以色列,曾以23岁成为以色列理工学院(相当于美国麻省理工学院、日本东京科学大学)史上最年轻博士,被誉为天才。

自2024年创立Decart.ai以来,公司已成为NVIDIA、AWS等大型AI企业关注的焦点。其开发了两种世界模型:“Lucy”用于视频流AI合成,“Oasis”则适用于仿真等多种场景。

随着Google和NVIDIA等低延迟AI半导体的推出,世界模型将加速普及

TPU 8i芯片

Decart.ai参加了Google Cloud Next '26的分会场“Google TPU路线图最新进展:TPU 8t和TPU 8i为前沿AI架构设计”主题讨论。

TPU(Tensor Processing Unit)是谷歌开发的AI专用半导体,类似于NVIDIA的GPU。传统AI半导体多专注于训练阶段,而当前推理阶段对计算能力的需求激增,促使NVIDIA及其竞争对手加快推出专为推理设计的芯片,如今年3月NVIDIA GTC发布的Groq LPU。

Google Cloud发布的TPU 8i专为推理优化,采用降低延迟的设计理念(Groq LPU亦是如此),使得Decart.ai的世界模型等对低延迟要求极高的应用得以实现更优性能。尽管当前演示仍有少许延迟,未来将持续优化网络和处理延迟。

低延迟AI芯片应用

利茨恩多尔CEO表示:“2026年将是低延迟推理普及的一年,届时世界模型及基于其的物理AI将迎来真正的爆发。”他强调,世界模型是今年最值得关注的AI技术之一。