近年来,谷歌I/O大会的焦点依旧围绕着谷歌不断推进的人工智能(AI)技术。谷歌表示,已有9亿用户使用其Gemini助手,用户通过Gemini生成的图像数量超过500亿张。

谷歌2026年的目标是将AI代理置于其所有主要服务的核心位置,包括搜索、Gmail、YouTube、Docs和Chrome浏览器。在大会前一天的演示中,谷歌及Alphabet CEO桑达尔·皮查伊表示,公司正处于AI技术的“高速发展”阶段,但也意识到用户更希望在日常使用的产品中看到实际价值。

以下是谷歌在I/O 2026上公布的全部内容。如果你关心Android 17的消息,谷歌已在上周详细介绍。

搜索体验升级

谷歌致力于将搜索融入用户生活的方方面面,推出了嵌入AI代理的“智能搜索框”。这一新搜索体验从今天开始向所有用户推送。

当你在搜索框中询问诸如“什么是黑洞?”或“谷歌AI概述是否冲击了新闻行业?”时,系统会提供更具上下文的答案,甚至利用生成式AI创建图像或短视频来辅助解释。例如,谷歌展示了一个关于黑洞的搜索,AI代理生成了一个视觉化解释过程的视频,直接嵌入搜索结果中。

搜索还引入了生成式用户界面(Generative UI),根据搜索结果动态生成不同的信息展示方式,如视频、图片、新闻文章等,提供定制化布局。该功能将于今年夏季全面上线。

此外,搜索代理正深入整合谷歌各平台。3月推出的Ask Maps功能,允许用户像与聊天机器人互动一样在地图上提问。

Gemini AI模型更新

谷歌发布了两款重要的AI模型更新:Gemini 3.5及其简化版Gemini 3.5 Flash,后者更经济实惠。两者即刻在谷歌搜索和Gemini应用中上线。

Gemini应用迎来Neural Expressive全新设计,拥有丰富多彩的背景、新字体和实时语音聊天动画,同时支持多种语言的区域口音选择。

即将推出的“每日简报”功能,将整合日历、邮件等信息,个性化总结和优先安排当天计划,成为用户早晨查看的首选内容。

谷歌还为其他服务加入了Gemini驱动的新功能。例如,Ask YouTube允许用户用自然语言搜索视频,AI代理会定位视频中相关内容的具体片段。

更创新的是Google Docs的语音编辑功能Docs Live,用户通过语音描述想写的内容,AI代理将实时转录、生成文本、引用网络资料,帮助将思绪转化为连贯文档。

(提醒:以上功能未来可能会包含广告。)

针对高级用户,谷歌推出月费100美元的AI Ultra订阅计划,并将顶级Gemini AI Ultra价格从每月250美元降至200美元。

Gemini Omni视频生成器

谷歌发布了Gemini Omni,一款类似OpenAI曾推出的Sora 2的AI视频生成器,但更注重真实感。它可以基于真实视频进行AI创意扩展,支持用户自拍视频更换背景、风格和环境,营造身处不同场景的效果。

现场演示中,一段金属雕塑的视频被AI改造成泡泡材质。用户还可上传相册中的图片和视频,生成多样的电影风格动画和趣味字体。

目前Omni主要聚焦视频创作,未来将支持静态图像和文本生成。谷歌希望最终实现任何输入生成任何输出。

OmniFlash是Omni的入门版,已对Google AI+ Pro和Ultra订阅用户开放。

Gemini Spark个人助理

Gemini Spark是谷歌针对现实生活需求的AI助手,类似于OpenClaw。它能帮你写邮件、策划活动,并从Google Drive中提取信息,成为你的私人日程管理助手。

Spark完全运行在谷歌云端,支持后台处理请求,无需设备持续在线。目前仅支持谷歌自家软件,Chrome浏览器和第三方支持预计今年夏季推出。

智能购物助手

谷歌将推出基于AI代理的购物体验,整合多家零售商的商品信息,支持统一购物车功能。用户可在浏览商品时添加心仪商品,代理会监控价格变动、新款发布等信息。

购物车内商品可通过谷歌安全支付系统一键购买,代理还能帮你在不同商家间寻找更优价格,或直接跳转至原零售商网站购买。

Flow创作工具升级

去年发布的Flow工具今年新增功能,帮助用户轻松制作宣传视频、派对邀请、音乐视频和短片。

用户只需上传一张照片,Flow即可生成16个独特视频片段,生动展现照片中的人物、场景和故事。上传简短旋律草稿,Flow能将其扩展为符合特定风格的完整歌曲。

谷歌智能眼镜亮相

谷歌推出两类“智能眼镜”:一类为音频眼镜,另一类内置小型显示屏。与三星及多家眼镜品牌合作,打造基于Android XR平台的产品。

首款音频眼镜将于今年秋季发布,支持Gemini语音聊天,内置耳边扬声器和摄像头,能识别用户视线,支持实时提问。合作品牌包括Warby Parker和Gentle Monster,价格信息稍后公布。

带显示屏的版本仍在开发中,预计晚于音频眼镜发布,支持显示短信、导航和搜索结果,并可实时翻译文字叠加视野。

眼镜还支持调用谷歌AI图像生成工具Nano Banana,用户可拍摄场景并添加AI特效。无显示屏版本可通过手机或安卓智能手表查看生成图像。

WIRED记者Julian Chokkattu体验了所有新款眼镜,提供了更深入的报道。