#语音识别 - AI情报

2026/08/01

美国xAI发布“Grok Voice Think Fast 2.0”，语音转写精度提升至最高两倍

美国xAI公司于7月29日（当地时间）正式发布了其下一代语音AI模型“Grok Voice Think Fast 2.0”。该服务的收费标准为每分钟0.08美元（约合12日元）。新模型在语音推理、对话能力以及工具调用的可靠性方面均有显著提升。与竞争对手如GPT-Realtime-2.1和Gemini 3.1 Flash等模型进行基准测试时，Grok Voice Think Fast 2.0以8

AI音频

2026/04/04

TurboScribe AI 智能转录与字幕生成工具

TurboScribe 是一款支持多语言、长时音视频转写与字幕生成的在线工具，提供高精度文字转录、字幕导出与翻译功能，适合播客主、自媒体创作者、教育机构和企业会议记录等多种场景。

AI资讯

2026/05/18

AmiVoice RolePlay新增AI对话型角色扮演功能

Advanced Media推出搭载AI语音识别的AmiVoice RolePlay新功能，实现更真实的商谈训练体验。

AI资讯

2026/07/25

PLAUD支持直接从ChatGPT和Claude等AI服务访问数据

日本国家PLAUD公司于23日宣布，其AI语音录音设备“Plaud”现已支持与外部服务的连接协议“Model Context Protocol（MCP）”。该功能无需额外费用，但需要拥有Plaud账户。用户可以直接通过ChatGPT、Claude等第三方AI服务访问存储在Plaud中的转录和摘要数据。过去，若要在其他AI服务中使用会议或商务谈判的语音数据，用户必须先从Plaud应用导出文字转录

日本SB C&S推出支持下一步行动的AI耳机「GLIDiC AI +u Buds」，在Makuake平台先行发售

AI资讯

2026/03/24

日本SB C&S推出支持下一步行动的AI耳机「GLIDiC AI +u Buds」，在Makuake平台先行发售

日本SB C&S宣布推出旗下AI产品品牌「GLIDiC AI」的首款产品——「GLIDiC AI +u Buds」（GLIDiC AI Plus U Buds），并将于3月26日在日本众筹平台Makuake开启先行销售。价格信息产品售价为2万9800日元，若选择Pro计划套装则为4万4600日元。在Makuake平台的支持购买价格方面，包含耳机和一年AI付费计划的套装享受40%超早鸟折

AI资讯

2026/07/25

OpenAI全新语音模式登陆ChatGPT桌面应用

OpenAI于周四宣布，已更新ChatGPT桌面应用，新增ChatGPT语音功能，用户可以通过语音与应用互动，控制AI助手并执行电脑上的任务。这一新功能基于OpenAI本月初推出的全新语音模型系列——ChatGPT-Live。 OpenAI表示，ChatGPT语音功能兼容ChatGPT Work和Codex，还能利用电脑操作技能访问网站和应用程序。此外，在macOS系统中，借助Appshots，

AI资讯

2026/05/22

谷歌发布“Docs Live”，实现语音指令自动生成文档

日本谷歌于5月19日（美国时间）宣布推出面向Google Workspace的新功能“Docs Live”，该功能通过语音指令辅助文档的构思与撰写。该功能将逐步向Google AI Pro和Ultra订阅用户开放，并计划于今年夏季以预览版形式向Google Workspace的企业客户推出。 “Docs Live”可作为用户的思维伙伴和协同写作助手，仅需通过语音输入，便能快速帮助用户整理思路并生

谷歌发布最新实时语音翻译模型“Gemini 3.5 Live Translate”

AI资讯

2026/06/12

谷歌发布最新实时语音翻译模型“Gemini 3.5 Live Translate”

谷歌推出支持70多种语言的实时语音翻译新模型，提升多语言交流体验。

AI资讯

2026/07/24

几周前，OpenAI推出了新一代对话模型，并更新了ChatGPT的语音模式。作为竞争对手，Anthropic也在积极改进其Claude语音模式，推出了最新更新。公司周四宣布，用户现在可以在Opus、Sonnet和Haiku三种模型之间进行选择。 Claude的语音模式最初于去年发布，基于Haiku模型，能够快速响应，但在处理复杂任务时表现有限。此次更新后，语音模式会默认选择用户在文本聊天中最后使用

AI资讯

2026/07/24

科大讯飞展示基于AI的电子笔记本与翻译设备

科大讯飞在东京举办媒体说明会，介绍了其最新AI产品线，包括电子笔记本、双屏翻译机和AI语音录音笔。

AI资讯

2026/07/09

OpenAI发布“GPT-Live”，实现更自然的对话与后台信息检索功能

OpenAI推出了新一代语音模型“GPT-Live”，支持实时双向交流和后台复杂处理，提升对话体验。

AI资讯

2026/03/14

Alexa+ 为什么表现如此糟糕？

经过一个多月使用这款15英寸屏幕上的Alexa+，我得出的结论是：Alexa+根本无法正常工作，缺乏我对智能家居设备所需的基本可靠性。虽然它仍处于早期访问阶段，但它的表现就像一个不可预测的蹒跚学步的孩子，乱撞一通且任务完成度很低。亚马逊在2025年对其知名语音助手进行了重塑，将生成式人工智能作为新体验的核心。今年早些时候，Alexa+向美国所有亚马逊Prime会员开放。Echo设备用户会自动切换