继今年四月推出MacOS专用的Gemini应用后,谷歌宣布将在未来几个月内为MacOS应用引入语音功能及新发布的类爪形自主AI助手Gemini Spark。这是谷歌在2026年Google I/O大会上的多项发布之一。

谷歌实验室、Gemini应用及AI Studio副总裁Josh Woodward在加州山景城总部的Google I/O现场演示了如何在MacBook上选择多份上传的文档(他以宠物相关的疫苗记录和过敏清单为例),然后长按功能键,通过语音指令让AI助手执行操作。

演示中,用户不仅可以口述一封与文档相关的邮件(并要求邮件语气“友好”),还可以同时指示Gemini将所选文件转换成表格。

松开功能键后,Gemini会整合多条语音请求,自动处理这些复杂信息。Woodward表示:“由于我在Finder中选择了这些文件,Gemini通过多模态理解,能够浏览PDF和发票图片,全部由语音控制,最终生成了内嵌表格。”

用户可在gemini.google/mac下载MacOS版Gemini应用,并通过简单快捷键启动。MacBook用户只需按下Option+Space即可随时访问Gemini。该应用已集成Gemini的多项核心功能,如Nano Banana图像生成技术。

虽然大多数人习惯通过手机或网页使用AI聊天机器人,但为桌面操作系统打造的原生应用仍属新兴趋势。鉴于Gemini将为苹果全新AI改版的Siri提供动力,MacBook内置Gemini也在情理之中。

Gemini的语音功能和Gemini Spark预计将于今夏正式登陆MacOS。