NVIDIA发布面向物理AI的开放世界模型“Cosmos 3”，推出三种版本适配不同场景

发布时间：2026/6/3

NVIDIA Cosmos 3

日本国家NVIDIA于1日宣布推出面向物理AI的开放世界基础模型“Cosmos 3”，该系统将视觉推理、世界生成和动作预测整合为一体。

Cosmos 3是一个完全开放的全能模型，能够原生理解和生成文本、图像、视频、环境音以及动作。这一能力显著缩短了物理AI训练和评估的周期，从传统的数月缩短至数日。

此外，日本国家NVIDIA还发起了“Cosmos Coalition”生态系统计划，联合Agile Robots、Black Forest Labs、Dyna Robotics、Generalist、LTX、Runway、Skild AI等模型构建者和AI开发者，共同推动下一代世界模型的发展。

Cosmos 3基于混合变换器（mixture-of-transformers）架构打造，旨在为机器人、自动驾驶汽车（AV）和视觉智能体提供支持，利用有限的训练数据和分散的仿真环境，实现对现实世界的泛化能力。

针对不同应用场景，Cosmos 3提供了多种版本：

Cosmos 3 Super：适用于机器人和自动驾驶等领域，强调最高级别的物理精度和生成质量，适合后期训练使用。
Cosmos 3 Nano：能够在几分之一秒内实现高质量视频生成和动作推理。
Cosmos 3 Edge：专为边缘设备的实时推理设计，预计近期发布。

对于开发者来说，Cosmos 3的主要用途包括：

理解多模态信息并进行推理的视觉语言模型。
模拟物理环境，预测未来世界状态，用于训练和评估的世界基础模型或视频基础模型。
作为机器人学习特定任务执行的世界行为模型的核心架构。

标签

#物理AI #开放世界模型 #视觉推理 #机器人技术 #自动驾驶

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

在Claude Cowork中使用Claude Fable 5

2026/07/17

在Claude Cowork中使用Claude Fable 5

Claude Fable 5是Anthropic推出的最强大且可广泛使用的模型，专为长时间运行、复杂且异步的工作设计。它特别擅长独立完成多步骤工作流程，比如进行深入研究并整合成初稿备忘录、在制作董事会演示前进行尽职调查，或批量审阅多个合同并提出修改建议等。该模型能够持续工作并在过程中不断测试和评估结果。要充分发挥Claude Fable 5的能力，需要调整与模型的协作方式。随着模型的不断进步，我

日本AI航海气象服务“SeaNavigator”推出智能手机应用

2026/07/08

日本AI航海气象服务“SeaNavigator”推出智能手机应用

日本气象新闻公司推出搭载AI的航海气象服务“SeaNavigator”智能手机应用，提升航运管理效率。

老一辈热衷送孙辈AI生成的儿童书，却难获孩子青睐

2026/07/29

老一辈热衷送孙辈AI生成的儿童书，却难获孩子青睐

三个月前，在一个反对人工智能的Reddit社区里，一位用户表达了一个常见的抱怨：他的母亲违背他的意愿，试图用AI制作一本关于他孙女的儿童书，准备作为生日礼物送给小女孩。 “我多次强调我不支持AI生成的艺术作品，并明确表示绝不允许她将我们的照片输入AI，也不允许使用我们的身份信息，”这位网友写道。“然而，她还是根据我孩子的经历创作故事情节，并让角色拥有与我孩子相似的特征，还用了我们家人的名字，让孩子