谷歌I/O聚焦智能眼镜与代理型AI的未来变革

谷歌I/O现场

今年我再次参加了谷歌I/O大会的报道。作为谷歌每年的开发者盛会，谷歌I/O总会带来大量新技术发布。不过，近年来面向消费者的硬件发布逐渐转移到了线上活动“Android Show”，我在上周的专栏中对此进行了介绍。

然而，谷歌I/O并非仅仅聚焦开发者话题。今年大会特别强调了“智能眼镜”领域，谷歌将其定位为“智能眼镜（Intelligent Eyewear）”，展示了这类设备的未来发展方向。

此外，搜索技术的革新也备受关注，我有幸对谷歌搜索技术负责人进行了专访，深入了解了搜索引擎如何融合AI，迈向智能代理的新时代。

这些变化的核心都围绕着“代理型AI（Agentic AI）”展开。继上次专栏的主题后，我总结了谷歌I/O上关于“代理型AI时代”的趋势，并探讨了这对拥有AI服务的企业意味着什么。

未来十年的核心：代理型转型（Agentic Transformation）

谷歌每年I/O的最后一天都会举办高层问答环节，谷歌CEO桑达尔·皮查伊被问及今年发布的内容中，哪些会在未来5至10年被铭记。他回答：

桑达尔·皮查伊

“今年的谷歌I/O奠定了我们产品整体代理型转型的基础。过去我们只是提供搜索信息，但现在开始实现持续对话，甚至能主动采取有意义的行动，帮助人们简化生活。”

换言之，谷歌正致力于将搜索从单纯的信息查询，转变为支持“从搜索到行动”的基础设施。

当前基于大型语言模型（LLM）的AI能够理解文本、分析图像和语音，但真正让人们感到便利的是AI能“替代人类完成任务”。代理型AI的核心在于，AI不仅执行单次指令，而是解析人类命令，委托合适的AI代理完成一系列任务，最终实现“代替人类行动”。

谷歌此次发布了代理型AI基础设施“Gemini Spark”，它能自动化会议流程、收集参与者反馈，并通过整合收件箱和日历信息，生成“每日简报（Daily Brief）”，帮助用户整理当天重要事项。

Gemini Spark功能示意

在搜索方面，系统还能监控价格和预订变动，及时提醒用户最佳时机。

价格监控提醒

软件开发本身就是代理型AI的典型应用。开发者们已经深刻体会到代理型AI如何改变工作流程。

谷歌还在搜索中引入了“生成式用户界面”，AI自动生成软件并提供交互式说明，这也是利用AI代理提升价值的体现。

生成式用户界面示意

Gemini Spark运行于谷歌云端的虚拟PC上，用户无需关心设备状态，也不需过多操作，就能获得所需信息和结果。

虽然像OpenClaw这样的方案强调本地PC与云端AI协同，但云端方案更适合大众使用。谷歌选择了云端方案，预计其他大厂也会采用类似策略。

作为AI模型，谷歌推出了“Gemini 3.5”，先发布了注重速度的“Gemini 3.5 Flash”，下月将推出更强的“Gemini 3.5 Pro”。

Gemini 3.5模型

如今，AI模型的智能程度已非焦点，关键是“AI如何改变人们生活”，而推动这一点的核心是加速代理型AI的应用。

谷歌此次强调的正是这一点，鼓励开发者基于代理型AI基础设施开发更多软件。

谷歌I/O现场

谷歌智能眼镜：代理AI的实际应用

我特别关注谷歌与三星联合开发的智能眼镜项目。谷歌称其为“智能眼镜”和“音频眼镜”，配备摄像头和麦克风，但无显示屏，通过与智能手机联动工作，支持Android和iOS，目标是广泛普及，预计今年秋季发布，尚未公布日本发售时间。

智能眼镜演示

此次演示中，AI应用并非停留在常见的识别场景。智能眼镜通过摄像头和麦克风成为AI的“眼睛”和“耳朵”，感知周围环境。

智能眼镜环境识别

但仅有感知并不足够，用户需要的是能执行命令的代理型AI。谷歌展示了通过智能眼镜下达指令完成咖啡订单的演示，未来无需掏出手机或电脑即可完成更多操作。

智能眼镜咖啡订单演示

谷歌此举也是为了迎战在该领域领先的Meta。Meta的AI眼镜已于两年前在美国上市，最近也进入日本市场。

Meta称其产品为“AI眼镜”，通常被称为智能眼镜。谷歌的“智能眼镜”本质上无异。

未来竞争将更加激烈，谷歌选择突出代理型AI元素，预计其他厂商也会在AI功能上持续强化。

智能眼镜的现状与未来方向

智能眼镜泛指眼镜形态的设备，功能和价格因搭载技术不同而差异巨大。与头戴显示器（如Meta Quest、苹果Vision Pro）相比，智能眼镜更轻便，使用场景和价格也不同。

目前最普及的是Meta的“Ray-Ban Meta”系列，5月21日已在日本发售。该系列与法国EssilorLuxottica合作，提供多样化设计，满足不同用户需求。Meta在海外成功很大程度上依赖于设计多样性、合理价格及广泛销售渠道。

我试用了日本发售的“Blayzer Optics (Gen 2)”，其可更换鼻托设计，支持度数镜片，使用体验良好。

Blayzer Optics (Gen 2)

Meta的主流AI眼镜不带显示屏，主要考虑成本和开发难度，也因为该产品最初并非源自AI技术。

目前智能眼镜最实用的是音频播放和摄像功能，AI功能仍在发展中，建议用户主要为摄像和音乐需求购买。

带显示屏的智能眼镜较少，Meta去年秋季发布了“Meta Ray-Ban Display”，但产量有限，尚未在美国以外地区推广。

谷歌去年I/O发布了内置显示屏的智能眼镜，今年现场演示的重点也是带显示屏的原型机，尚未量产。

显示屏能显示文字和图像，有助于AI应用，但技术挑战不小。Even Realities的“Even G2”和Rokid的“Rokid AI眼镜”采用低功耗微型LED，但目前仅能显示绿色，应用场景有限。

采用微型OLED的XREAL和VITURE产品则更像是需连接PC或手机的显示器，方向与AI眼镜有所不同。

谷歌与XREAL合作开发“Project Aura”，类似谷歌和三星为对抗苹果Vision Pro开发的“Galaxy XR”，采用外置主机和透光显示屏，目标是实现轻便的眼镜级体验。我亲自体验过，设备轻巧且体验良好。

Project Aura体验

不过，AI眼镜和智能眼镜并非设计为长时间佩戴，也不建议持续户外使用。

Meta通过不同品牌区分产品线，谷歌则统一使用“Android XR”品牌推出多款产品。

关键在于AI能力和开发平台。Meta急需强化AI，目前面临较大挑战；谷歌尚未正式推出产品，正处于起步阶段。中国厂商也在从不同角度切入该领域。

未来还有哪些企业将加入竞争尚未明朗，但无论如何，强化代理型AI基础设施是必然趋势。谷歌正是基于这一认识，推动智能眼镜开发，发挥自身优势。

谷歌I/O聚焦智能眼镜与代理型AI的未来变革

未来十年的核心：代理型转型（Agentic Transformation）

谷歌智能眼镜：代理AI的实际应用

智能眼镜的现状与未来方向

标签

评论

相关阅读

融合实践经验与生成式AI的“富士通AI驱动现代化服务”

OpenAI提出超智能社会的“AI权利”和“每周四天工作制”建议

社交媒体热议特朗普与AI版罗斯福总统对话：他真的以为是真人吗？