AI音频AssemblyAI 语音转写与语音理解平台
AssemblyAI 提供行业领先的语音转文字与语音理解模型,帮助企业从语音数据中高精度提取内容与洞察,快速构建和扩展各类语音智能产品。
按标签聚合查看文章内容。
AI音频AssemblyAI 提供行业领先的语音转文字与语音理解模型,帮助企业从语音数据中高精度提取内容与洞察,快速构建和扩展各类语音智能产品。
AI资讯Cohere于2026年3月26日推出了开源语音识别模型Cohere Transcribe,拥有20亿参数,专为边缘设备设计,解决大型语音模型带来的延迟问题。该模型支持14种语言,性能超越主流竞争对手,旨在通过开发者社区推动生态发展并实现商业化。
AI资讯DeepL Japan推出的实时AI语音翻译解决方案,助力多语言会议高效沟通。
AI资讯DeepL日本公司推出了实时AI语音翻译系统“DeepL Voice-to-Voice”,支持多场景多语言即时语音翻译。
AI资讯IBM推出了专为边缘计算和企业应用优化的Granite4.01B语音模型,参数减半性能提升,支持多语言语音识别和双向翻译,新增日语识别及关键词偏置功能,显著提升英语转录准确率。
AI资讯Advanced Media推出搭载AI语音识别的AmiVoice RolePlay新功能,实现更真实的商谈训练体验。
AI资讯智能眼镜作为继智能手机之后的潜力设备,正逐渐改变人们的交互方式和生活习惯。
AI资讯2024年3月27日,日本时间,Google宣布在iOS和Android版的“Google翻译”应用中,扩大了通过耳机实时听取翻译内容的直播翻译功能的适用区域。 用户只需佩戴耳机并开启应用中的直播翻译功能,即可实时听到同步翻译的语音。该功能利用了Google最新的Gemini语音对译技术,AI能够生成包含说话者语调、重音和抑扬顿挫的合成语音,帮助用户更轻松地理解“谁说了什么”。这项技术适用于日常
AI资讯美国谷歌公司于3月27日(日本时间)宣布,Android和iOS版“Google”应用中的“Search Live”功能现已支持日语。该功能利用谷歌搜索的AI模式,能够识别摄像头所见内容,实时通过语音回答用户提问,并提供相关网站链接。此次更新使得包括日本在内的200多个国家和地区的用户都能通过谷歌AI模式进行对话。 用户只需在“Google”应用的搜索栏下方点击带有三条竖线的“直播”按钮,然后用
AI资讯微软发布了支持自动语音识别和文本转语音的VibeVoice语音AI模型,具备长音频处理、多说话人对话生成和实时低延迟等特性,已在GitHub获得27K星。该项目采用MIT许可证,支持本地部署,无需云服务费用,推动语音合成领域创新。
AI商业Gridspace 是一款面向现代联络中心的智能会话与虚拟呼叫中心平台,提供虚拟坐席与语音可观测能力,帮助企业实时理解并自动化语音通话、聊天和客户对话。
AI资讯日本国家Slack公司为其个人AI助手“Slackbot”增添了全新功能。用户此前需要分别操作的应用程序、数据源及第三方代理,现在可以通过Slack中的单一对话界面统一管理。 Slackbot能够将用户使用的应用、代理及数据整合到一个对话式界面中。它与Slack内积累的对话、决策和知识库相连接,直接访问业务所需信息。与公开信息不同,Slackbot能理解企业业务背景,提供针对性回答。 此次功能升