AI资讯Thinking Machines原生交互模型——TML-Interaction-Small 276B-A12B推动实时语音技术新高度
Thinking Machines团队发布了全新交互模型TML-Interaction-Small,凭借2760亿参数和12亿活跃参数,显著提升了实时语音模型的性能,开创了人机协作的新范式。
按标签聚合查看文章内容。
AI资讯Thinking Machines团队发布了全新交互模型TML-Interaction-Small,凭借2760亿参数和12亿活跃参数,显著提升了实时语音模型的性能,开创了人机协作的新范式。
AI资讯美国谷歌公司于3月26日(当地时间)正式发布了最新的实时语音生成模型“Gemini 3.1 Flash Live”。该模型被认为是谷歌迄今为止质量最高的实时语音AI模型。 “Gemini 3.1 Flash Live”是继承自“Gemini 2.5 Flash Native Audio”的新一代语音生成模型。相比前代产品,它在响应延迟和语音理解准确度方面都有显著提升。 例如,在评估多步骤函数调用
AI资讯OpenAI 推出三款全新实时语音模型,提升语音智能应用体验,推动语音代理迈向更高水平。