2025年8月,谷歌震惊了AI领域,推出了一款能够将简单图像转化为全新互动世界的研究模型——Genie 3。该模型展示了AI在未来应用中的巨大潜力。
如今,这一未来已成现实。谷歌近日发布了Project Genie,这是一款实验性原型,能够将简单的提示和图像转变为可完全探索的虚拟世界。这些AI世界是可玩且互动的环境,用户可以体验从太空行走到山间跳伞的各种场景。那么,这些世界是如何构建的?它们又能实现哪些功能?让我们一探究竟。
从提示到完整世界
Project Genie是一款基于谷歌最强大模型的网页应用,包括Gemini 3、Nano Banana Pro和Genie 3。该体验围绕三大核心创作路径展开:
世界草图
在Project Genie中,用户可以利用“世界草图”工具预览创作内容。借助Nano Banana Pro,用户能快速查看提示生成的预览效果,并在无需完整生成项目的情况下进行调整。例如,用户可以多次修改世界的天气设定,直到满意为止。

世界探索
构建世界只是开始,用户还可以实际探索这些虚拟环境。随着用户的移动,Genie会实时生成前方路径。每个世界都是独一无二的实时体验,而非预先渲染的关卡,用户的行为会影响世界的生成。
世界重混
迭代是AI工具的重要环节。创建初始世界后,用户可以进一步优化体验,调整角色、环境或背景,同时保留满意的元素。用户还可以选择重混谷歌公开的模板世界。
现实中的限制
尽管Project Genie令人兴奋,但仍处于世界模型的早期阶段,存在一些限制:
- 真实感:世界并非总是“真实”,物理表现可能异常,用户可能穿透物体。
- 控制性:角色操作有时难以控制或无响应,复杂世界中可能出现延迟。
- 时长:生成体验目前限制在60秒内,主要因为时间越长,世界质量越难保证。
如何体验
由于处于实验阶段,Project Genie的访问权限非常有限,仅向美国的谷歌AI Ultra订阅用户开放。此举旨在逐步推广,避免系统过载。
个人看法
理解Project Genie的强大,需先了解其背后的“世界模型”技术。与传统语言模型预测下一个词不同,世界模型试图预测并模拟整个环境的未来,创造一个动态空间,让用户的行为影响世界发展。这是AI更好理解复杂主题及因果关系的基础,也是2026年最令人印象深刻的AI工具之一。Project Genie不仅是一个“酷炫的游戏工具”,更是构建能够理解和模拟复杂动态环境的世界模型的重要一步。无论是游戏原型设计还是互动学习体验开发,Genie 3都为AI实验提供了全新方式。
如果你想亲自体验或查看示例,请访问Project Genie官网。


