#实时语音 - AI情报

2026/03/28

谷歌发布最新实时语音AI模型“Gemini 3.1 Flash Live”

美国谷歌公司于3月26日（当地时间）正式发布了最新的实时语音生成模型“Gemini 3.1 Flash Live”。该模型被认为是谷歌迄今为止质量最高的实时语音AI模型。 “Gemini 3.1 Flash Live”是继承自“Gemini 2.5 Flash Native Audio”的新一代语音生成模型。相比前代产品，它在响应延迟和语音理解准确度方面都有显著提升。例如，在评估多步骤函数调用

Thinking Machines原生交互模型——TML-Interaction-Small 276B-A12B推动实时语音技术新高度

AI资讯

2026/05/13

Thinking Machines原生交互模型——TML-Interaction-Small 276B-A12B推动实时语音技术新高度

Thinking Machines团队发布了全新交互模型TML-Interaction-Small，凭借2760亿参数和12亿活跃参数，显著提升了实时语音模型的性能，开创了人机协作的新范式。

GPT-Realtime-2、-Translate 与 -Whisper：全新实时语音API引领行业新标杆

AI资讯

2026/05/08

GPT-Realtime-2、-Translate 与 -Whisper：全新实时语音API引领行业新标杆

OpenAI 推出三款全新实时语音模型，提升语音智能应用体验，推动语音代理迈向更高水平。