谷歌I/O现场

今年我再次参加了谷歌I/O大会的报道。作为谷歌每年的开发者盛会,谷歌I/O总会带来大量新技术发布。不过,近年来面向消费者的硬件发布逐渐转移到了线上活动“Android Show”,我在上周的专栏中对此进行了介绍。

然而,谷歌I/O并非仅仅聚焦开发者话题。今年大会特别强调了“智能眼镜”领域,谷歌将其定位为“智能眼镜(Intelligent Eyewear)”,展示了这类设备的未来发展方向。

此外,搜索技术的革新也备受关注,我有幸对谷歌搜索技术负责人进行了专访,深入了解了搜索引擎如何融合AI,迈向智能代理的新时代。

这些变化的核心都围绕着“代理型AI(Agentic AI)”展开。继上次专栏的主题后,我总结了谷歌I/O上关于“代理型AI时代”的趋势,并探讨了这对拥有AI服务的企业意味着什么。

未来十年的核心:代理型转型(Agentic Transformation)

谷歌每年I/O的最后一天都会举办高层问答环节,谷歌CEO桑达尔·皮查伊被问及今年发布的内容中,哪些会在未来5至10年被铭记。他回答:

桑达尔·皮查伊

“今年的谷歌I/O奠定了我们产品整体代理型转型的基础。过去我们只是提供搜索信息,但现在开始实现持续对话,甚至能主动采取有意义的行动,帮助人们简化生活。”

换言之,谷歌正致力于将搜索从单纯的信息查询,转变为支持“从搜索到行动”的基础设施。

当前基于大型语言模型(LLM)的AI能够理解文本、分析图像和语音,但真正让人们感到便利的是AI能“替代人类完成任务”。代理型AI的核心在于,AI不仅执行单次指令,而是解析人类命令,委托合适的AI代理完成一系列任务,最终实现“代替人类行动”。

谷歌此次发布了代理型AI基础设施“Gemini Spark”,它能自动化会议流程、收集参与者反馈,并通过整合收件箱和日历信息,生成“每日简报(Daily Brief)”,帮助用户整理当天重要事项。

Gemini Spark功能示意

在搜索方面,系统还能监控价格和预订变动,及时提醒用户最佳时机。

价格监控提醒

软件开发本身就是代理型AI的典型应用。开发者们已经深刻体会到代理型AI如何改变工作流程。

谷歌还在搜索中引入了“生成式用户界面”,AI自动生成软件并提供交互式说明,这也是利用AI代理提升价值的体现。

生成式用户界面示意

Gemini Spark运行于谷歌云端的虚拟PC上,用户无需关心设备状态,也不需过多操作,就能获得所需信息和结果。

虽然像OpenClaw这样的方案强调本地PC与云端AI协同,但云端方案更适合大众使用。谷歌选择了云端方案,预计其他大厂也会采用类似策略。

作为AI模型,谷歌推出了“Gemini 3.5”,先发布了注重速度的“Gemini 3.5 Flash”,下月将推出更强的“Gemini 3.5 Pro”。

Gemini 3.5模型

如今,AI模型的智能程度已非焦点,关键是“AI如何改变人们生活”,而推动这一点的核心是加速代理型AI的应用。

谷歌此次强调的正是这一点,鼓励开发者基于代理型AI基础设施开发更多软件。

谷歌I/O现场

谷歌智能眼镜:代理AI的实际应用

我特别关注谷歌与三星联合开发的智能眼镜项目。谷歌称其为“智能眼镜”和“音频眼镜”,配备摄像头和麦克风,但无显示屏,通过与智能手机联动工作,支持Android和iOS,目标是广泛普及,预计今年秋季发布,尚未公布日本发售时间。

智能眼镜演示

此次演示中,AI应用并非停留在常见的识别场景。智能眼镜通过摄像头和麦克风成为AI的“眼睛”和“耳朵”,感知周围环境。

智能眼镜环境识别

但仅有感知并不足够,用户需要的是能执行命令的代理型AI。谷歌展示了通过智能眼镜下达指令完成咖啡订单的演示,未来无需掏出手机或电脑即可完成更多操作。

智能眼镜咖啡订单演示

谷歌此举也是为了迎战在该领域领先的Meta。Meta的AI眼镜已于两年前在美国上市,最近也进入日本市场。

Meta称其产品为“AI眼镜”,通常被称为智能眼镜。谷歌的“智能眼镜”本质上无异。

未来竞争将更加激烈,谷歌选择突出代理型AI元素,预计其他厂商也会在AI功能上持续强化。

智能眼镜的现状与未来方向

智能眼镜泛指眼镜形态的设备,功能和价格因搭载技术不同而差异巨大。与头戴显示器(如Meta Quest、苹果Vision Pro)相比,智能眼镜更轻便,使用场景和价格也不同。

目前最普及的是Meta的“Ray-Ban Meta”系列,5月21日已在日本发售。该系列与法国EssilorLuxottica合作,提供多样化设计,满足不同用户需求。Meta在海外成功很大程度上依赖于设计多样性、合理价格及广泛销售渠道。

我试用了日本发售的“Blayzer Optics (Gen 2)”,其可更换鼻托设计,支持度数镜片,使用体验良好。

Blayzer Optics (Gen 2)

Meta的主流AI眼镜不带显示屏,主要考虑成本和开发难度,也因为该产品最初并非源自AI技术。

目前智能眼镜最实用的是音频播放和摄像功能,AI功能仍在发展中,建议用户主要为摄像和音乐需求购买。

带显示屏的智能眼镜较少,Meta去年秋季发布了“Meta Ray-Ban Display”,但产量有限,尚未在美国以外地区推广。

谷歌去年I/O发布了内置显示屏的智能眼镜,今年现场演示的重点也是带显示屏的原型机,尚未量产。

显示屏能显示文字和图像,有助于AI应用,但技术挑战不小。Even Realities的“Even G2”和Rokid的“Rokid AI眼镜”采用低功耗微型LED,但目前仅能显示绿色,应用场景有限。

采用微型OLED的XREAL和VITURE产品则更像是需连接PC或手机的显示器,方向与AI眼镜有所不同。

谷歌与XREAL合作开发“Project Aura”,类似谷歌和三星为对抗苹果Vision Pro开发的“Galaxy XR”,采用外置主机和透光显示屏,目标是实现轻便的眼镜级体验。我亲自体验过,设备轻巧且体验良好。

Project Aura体验

不过,AI眼镜和智能眼镜并非设计为长时间佩戴,也不建议持续户外使用。

Meta通过不同品牌区分产品线,谷歌则统一使用“Android XR”品牌推出多款产品。

关键在于AI能力和开发平台。Meta急需强化AI,目前面临较大挑战;谷歌尚未正式推出产品,正处于起步阶段。中国厂商也在从不同角度切入该领域。

未来还有哪些企业将加入竞争尚未明朗,但无论如何,强化代理型AI基础设施是必然趋势。谷歌正是基于这一认识,推动智能眼镜开发,发挥自身优势。