谷歌宣布推出集成于键盘应用“Gboard”的全新语音输入功能“Rambler”。该功能利用生成式AI“Gemini”的语言理解能力,能够从人类自然的口语中剔除多余词汇,整理重点内容并转化为文本。

Rambler示意图

消除“口语”与“书面语”的差距

谷歌指出,虽然现有语音输入技术在速度和准确性上表现优异,但人类自然对话中常包含“嗯”、“那个”等填充词以及频繁的自我修正。Rambler突破了传统“逐字输入”的模式,借助AI理解用户意图,将口语转换为更适合书写的表达。用户无需刻意准确表达,AI会自动提取关键信息,生成简洁明了的消息。

自动反映修正内容与实时格式调整

演示中展示了通过语音创建购物清单的场景。当用户列出“牛油果”、“鸡蛋”等物品后,口头更改为“还是不要香蕉了”,Rambler能自动从文本中剔除“香蕉”。

该功能不仅识别输入内容,还能理解思路变化,重构信息以保证语义通顺。此外,用户还可通过语音指令如“请用列表形式,并添加我喜欢的表情符号”来即时调整文本格式和风格。

Rambler不仅适用于消息应用,还支持邮件撰写、文档编辑,甚至AI助手的提示输入,覆盖所有使用Gboard的场景。

支持多语言混合输入与隐私保护的数据处理

得益于Gemini强大的多语言模型,用户在同一条消息中切换多种语言(如英语与印地语)时,AI能准确理解上下文和细微差别,忠实转换为文本。

Rambler内嵌于Gboard,使用时界面会明确显示功能状态。语音转文字过程在云端完成,数据处理后立即返回设备,确保语音内容不会被保存或记录,保障用户隐私安全。