Google发布Gemini 3.1 Flash TTS，AI语音表现力大幅提升

发布时间：2026/4/17

Gemini 3.1 Flash TTS

Google推出了最新的文本转语音模型“Gemini 3.1 Flash TTS”。该模型在控制性、表现力和音质方面均有显著提升，旨在帮助开发者、企业及普通用户构建下一代AI语音应用。截至4月16日，Gemini 3.1 Flash TTS已通过Gemini API和Google AI Studio向开发者预览开放，同时企业用户可通过Vertex AI预览版使用，Google Workspace用户也能通过Google Vid体验。

Gemini 3.1 Flash TTS整体音质优于以往版本。在反映数千名视障者偏好的基准测试“Artificial Analysis”中，取得了1211的高分。该模型支持70多种语言，具备出色的自然语言创意控制能力，并内置“多说话人”功能，能够自然地支持多角色对话。

音声タグ制御

此外，Gemini 3.1 Flash TTS引入了语音标签功能，用户可以通过在文本中插入标签，直观地控制语音的风格、语速和发音方式，实现情感和说话风格的细致调整。

值得一提的是，所有由Gemini 3.1 Flash TTS生成的语音均嵌入了Google的电子水印技术“SynthID”，这有助于准确识别AI生成内容，防止虚假信息的传播。

标签

#文本转语音 #AI语音技术 #多语言支持 #语音合成 #内容安全

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

TechCrunch出行：汽车行业的AI技能竞赛即将来临

2026/05/18

TechCrunch出行：汽车行业的AI技能竞赛即将来临

欢迎回到TechCrunch出行——您获取未来交通新闻与洞察的中心平台。想要免费订阅，请访问TechCrunch出行官网。当前交通领域乃至各行各业都呈现出一个趋势：人工智能（AI）正在为部分人创造就业机会，同时也导致另一些岗位消失。以通用汽车（General Motors）为例，该公司裁减了其IT部门超过10%的员工，约600名正式员工，进行了一场有意的技能置换。虽然这并非一对一的岗位替换，意

日本TISI与AtStream Consulting发布面向系统规划构想流程的AI代理实证成果

2026/08/01

日本TISI与AtStream Consulting发布面向系统规划构想流程的AI代理实证成果

日本TISI株式会社与日本AtStream Consulting株式会社于28日宣布，基于TISI的生成式AI业务支持服务“Agentic AI Platform”，开发了一款支持系统规划构想流程输出制作的AI代理应用，并通过实际项目应用验证了其效果。 “Agentic AI Platform”是一个无需编码即可开发结合多种AI功能的业务支持应用的平台。此次，TISI与AtStream Consu

微软Copilot AI被曝一键泄露2FA验证码，助黑客窃取账户

2026/06/18

微软Copilot AI被曝一键泄露2FA验证码，助黑客窃取账户

微软的Copilot企业版聊天机器人存在严重安全漏洞，黑客仅需点击一次即可窃取用户的双因素认证代码，暴露敏感数据。