谷歌发布AI生成的虚拟世界

2025年8月，谷歌震惊了AI领域，推出了一款能够将简单图像转化为全新互动世界的研究模型——Genie 3。该模型展示了AI在未来应用中的巨大潜力。

如今，这一未来已成现实。谷歌近日发布了Project Genie，这是一款实验性原型，能够将简单的提示和图像转变为可完全探索的虚拟世界。这些AI世界是可玩且互动的环境，用户可以体验从太空行走到山间跳伞的各种场景。那么，这些世界是如何构建的？它们又能实现哪些功能？让我们一探究竟。

从提示到完整世界

Project Genie是一款基于谷歌最强大模型的网页应用，包括Gemini 3、Nano Banana Pro和Genie 3。该体验围绕三大核心创作路径展开：

世界草图

在Project Genie中，用户可以利用“世界草图”工具预览创作内容。借助Nano Banana Pro，用户能快速查看提示生成的预览效果，并在无需完整生成项目的情况下进行调整。例如，用户可以多次修改世界的天气设定，直到满意为止。

World sketching example in Project Genie

世界探索

构建世界只是开始，用户还可以实际探索这些虚拟环境。随着用户的移动，Genie会实时生成前方路径。每个世界都是独一无二的实时体验，而非预先渲染的关卡，用户的行为会影响世界的生成。

世界重混

迭代是AI工具的重要环节。创建初始世界后，用户可以进一步优化体验，调整角色、环境或背景，同时保留满意的元素。用户还可以选择重混谷歌公开的模板世界。

现实中的限制

尽管Project Genie令人兴奋，但仍处于世界模型的早期阶段，存在一些限制：

真实感：世界并非总是“真实”，物理表现可能异常，用户可能穿透物体。
控制性：角色操作有时难以控制或无响应，复杂世界中可能出现延迟。
时长：生成体验目前限制在60秒内，主要因为时间越长，世界质量越难保证。

如何体验

由于处于实验阶段，Project Genie的访问权限非常有限，仅向美国的谷歌AI Ultra订阅用户开放。此举旨在逐步推广，避免系统过载。

个人看法

理解Project Genie的强大，需先了解其背后的“世界模型”技术。与传统语言模型预测下一个词不同，世界模型试图预测并模拟整个环境的未来，创造一个动态空间，让用户的行为影响世界发展。这是AI更好理解复杂主题及因果关系的基础，也是2026年最令人印象深刻的AI工具之一。Project Genie不仅是一个“酷炫的游戏工具”，更是构建能够理解和模拟复杂动态环境的世界模型的重要一步。无论是游戏原型设计还是互动学习体验开发，Genie 3都为AI实验提供了全新方式。

如果你想亲自体验或查看示例，请访问Project Genie官网。

谷歌发布AI生成的虚拟世界

从提示到完整世界

世界草图

世界探索

世界重混

现实中的限制

如何体验

个人看法

标签

评论

相关阅读

DeepSeek 模型大全：V3.2、R1、Coder、OCR 等全系对比指南

DeepSeek 能在本地跑在 NVIDIA RTX 显卡上吗？一文讲清型号、显存和坑

.claude/ 文件夹完全指南：从黑盒到你的团队控制台