“这是为那些想将自己融入内容中,但又不想亲自拍摄的创作者准备的,”Roman说道。

这种以社交为核心、自拍风格的深度换脸技术让人联想到OpenAI已停运的Sora应用中的经典功能——谷歌称之为“头像”,而非简单的客串或角色。这些头像同样可以通过Gemini应用和YouTube使用。谷歌在加州山景城举办的年度I/O开发者大会上宣布了这一新功能。

去年,谷歌在其实验性Labs部门推出了Flow。“谷歌以前从未有过专门针对创意工作的产品线,”Roman表示,“生产力工具有,开发者工具有,视频观看工具也有,但专门为创意工作设计的产品没有。”他认为这是谷歌为下一代创作者打造工具的尝试。

类似于谷歌I/O大会上关于谷歌搜索的其他发布,Flow的许多新变化都是谷歌推动AI代理(自动化软件任务管理者)和“vibe coding”(通过自然语言提示AI构建定制功能)走向更广泛用户的战略一部分。例如,用户可以在生成视频时重复自定义指令,还能创建自动化工作流,将风格相似的视频片段分类存放。

Flow最显著的变化之一是采用了新的视频生成模型Omni Flash,取代了之前的Veo模型。类似于谷歌的Nano Banana模型为AI图像创作带来更多世界背景信息,Omni Flash模型则在视频生成中提升了画面细节的丰富度。

借助Omni Flash模型,Flow用户可以更稳定地生成AI视频中的角色。Roman表示,这大大改善了之前版本中角色在连续视频生成时可能出现的变形问题。更重要的是,Flow用户现在可以在AI场景中生成的关键角色之一就是他们自己。

用户只需进入Flow账户设置,通过手机扫描二维码,谷歌便会引导用户录制一串数字并转动头部以捕捉多角度影像,从而建立“头像”。这种自拍捕捉方式对曾使用过OpenAI去年推出的Sora应用的用户来说非常熟悉。Sora是一个以AI为核心的社交媒体平台,用户可以生成并分享自己的视频片段,但该应用在不到七个月后被意外关闭。

与Sora不同,谷歌目前的头像功能仅允许用户创建自己的AI版本,而非他人。所有使用Omni模型生成的视频,包括带有用户头像的视频,都会带有谷歌的SynthID水印。

“你可以从多个角度捕捉自己的声音和视觉形象,且展现出相当高的真实度,”Roman说。他曾用Flow制作了一段自嘲视频,视频中AI版本的自己栩栩如生,声音也极为相似。随后,他通过Flow请求更换背景和衣服颜色,Omni Flash模型在保持头像细节的同时调整了视频内容。

这并非谷歌首次为创作者推出可自控的深度换脸视频工具——上个月,YouTube Shorts也新增了类似的AI头像功能,允许用户将其插入短视频中。硅谷其他公司也在探索利用生成式AI改变创作者作品的方式。例如,Meta去年推出了一项AI功能,能够无缝将Instagram Reels翻译成多种语言,甚至调整创作者的唇形以匹配不同语言的声音。

虽然这些AI工具能简化创作者的内容制作流程——现在甚至无需起床就能生成风趣的竖屏视频,但生成式AI也日益引发争议,一些观众认为这类视频缺乏真实性或与其价值观不符——前提是他们能识别出这些视频是AI生成的。