谷歌的年度开发者大会近年来规模不断扩大,甚至被拆分成了两个独立的活动。上周,谷歌举办了一场专注于其Android移动操作系统、Googlebooks等产品的活动,而今天的大会则聚焦于其余平台的最新进展。

这两场活动的共同主题是公司的人工智能工具,尤其是围绕其Gemini聊天机器人及相关技术展开。可以说,2026年的关键词就是“智能代理”。

虽然此类活动往往充斥着“你可以这样做!”和“新模型新功能”的展示,但有几项新功能和技术在我看来尤为突出,包括Google Docs Live、Ask YouTube的部分功能、Google Flow及Flow Music的升级,以及智能眼镜产品。

大会的主要受众是开发者,因此也展示了许多便于快速生成用户界面、提升模型效率等开发工具,但我更关注的是这些技术最终如何惠及普通用户。

完整报道请参见我们的谷歌I/O 2026专题,以及我们的现场博客

Google Docs Live

Docs Live可以将你的语音笔记转录并整理成文档,这对我来说是管理测试产品时各种零散想法的理想工具(目前我还得频繁切换记录笔记)。喜欢用说话代替打字的人也能从中受益——前提是它的表现足够好。谷歌CEO桑达尔·皮查伊称之为“口头大脑倾倒”。

该功能似乎不强制访问你的谷歌账户或浏览历史,这一点对我来说是采用谷歌AI工具的一大障碍,虽然如果授权访问,效果会更佳。

当然,这项服务并非免费,仅对订阅谷歌AI的Pro(每月20美元)或Ultra(每月100或200美元)用户开放。

谷歌搜索

谷歌持续将AI深度整合进其搜索引擎,统一AI驱动的搜索工具,增强智能代理功能,并引入更多上下文信息,如上传的照片、PDF文件和打开的Chrome标签页。

谷歌还将其用于识别AI生成或修改图片的技术SynthID扩展到Chrome浏览器,但该技术依赖合作伙伴支持,可能无法识别所有模型生成的内容。

新推出的智能搜索框支持复杂的自然语言查询及后续追问,还能通过多模态代理执行操作并生成视觉结果,比如示例模拟。

更有趣的是,用户可以创建定制的智能小部件,类似于一种“氛围代理”,用于保存复杂且重复的搜索和操作。

Ask YouTube

YouTube一直是重要的搜索引擎,尤其是教程类内容。通过Ask YouTube,用户可以用自然语言查询视频内容,并直接跳转到视频中相关部分。

这一功能可能引发争议,因为它可能大幅减少创作者的收入,后者通常依赖观众观看时长和广告播放。

不过,我个人在查找教程和游戏攻略时常常跳过视频结果,因为不喜欢反复拖动视频寻找所需信息。尽管如此,大多数人可能并不这么做,因此这对许多创作者来说可能是净损失。

目前该功能仅对YouTube Premium订阅用户开放。

Google Flow 和 Flow Music

谷歌最新的多模态生成AI模型Omni支持从文本、音频、视频和图片等多种输入生成视频。其加速版本Omni Flash驱动着Flow和Flow Music这两款视频与音乐创作软件。

Flow现集成了对话代理,能够带入当前及过去项目的上下文,协助头脑风暴和模板创建,并且理论上更擅长物理模拟。谷歌还声称Omni Flash能实现更精准的编辑。

Flow Music则新增了对作品部分编辑的支持,比如替换或修改歌词而不影响节拍。

这些功能有望提升创作流程效率,而非简单生成低质内容,当然后者也难免出现。

Flow和Flow Music的原生移动应用对所有AI订阅用户开放。

智能眼镜

谷歌将其智能眼镜产品统称为智能眼镜,涵盖XR眼镜和纯音频设备。

我个人不太喜欢纯音频智能设备,比如CES上发布的头戴设备,因为它们需要用户记住刚刚说过或做过的事情,我更需要视觉辅助。

但对记忆力较好的人来说,这类设备可能颇具吸引力。佩戴带有抬头显示的眼镜可能会带来安全隐患,类似手机使用时的分心问题。

我更感兴趣的是Project Aura,这款产品已开发多年,预计今年晚些时候上市。它看起来像是轻量级VR设备——一副Xreal眼镜加上运行Android XR的高通骁龙处理器小盒子,可连接手机、笔记本或Steam Deck等设备。

谷歌还与眼镜品牌如Warby Parker和Gentle Monster合作,相关产品预计今年秋季推出。

值得注意的是,部分智能眼镜将支持iOS,与iPhone(甚至iPad)兼容。苹果计划在今年夏天的MacOS中引入Gemini Spark和Gemini Voice,这也预示着6月WWDC上会有更多相关产品发布。

反思

总的来说,从这场三小时的活动中挑出五项感兴趣的内容并不多。相比之下,更多内容让我觉得问题重重,甚至有些反乌托邦色彩。有时直播中的掌声似乎是预录的,因为现场实际掌声寥寥。

许多智能代理功能似乎还在寻找用户,谷歌对这些“无人问津”的智能功能可能带来的负面影响显得有些视而不见。

例如,谷歌为Chrome推出的智能购物平台虽然对零售商友好,但也引发了责任归属等问题。购物过程中的摩擦对消费者未必是坏事,但对卖家来说却是阻碍,因为他们通常不希望用户有太多思考时间。

公平地说,谷歌I/O的主要观众是开发者和投资者,他们更关心这些变化如何带来收益。