#语音识别

按标签聚合查看文章内容。

Slackbot新增跨应用自动化功能,实现业务流程一体化管理AI资讯

Slackbot新增跨应用自动化功能,实现业务流程一体化管理

日本国家Slack公司为其个人AI助手“Slackbot”增添了全新功能。用户此前需要分别操作的应用程序、数据源及第三方代理,现在可以通过Slack中的单一对话界面统一管理。 Slackbot能够将用户使用的应用、代理及数据整合到一个对话式界面中。它与Slack内积累的对话、决策和知识库相连接,直接访问业务所需信息。与公开信息不同,Slackbot能理解企业业务背景,提供针对性回答。 此次功能升

谷歌悄然推出支持离线的AI语音转写应用AI资讯

谷歌悄然推出支持离线的AI语音转写应用

谷歌于周一悄然发布了一款名为“Google AI Edge Eloquent”的离线优先语音转写应用,目前仅在iOS平台上线,旨在与Wispr Flow、SuperWhisper、Willow等同类产品竞争。该应用免费下载,用户只需下载基于Gemma的自动语音识别(ASR)模型,即可开始在手机上进行语音转写。 应用内支持实时转录,暂停时会自动过滤“嗯”、“啊”等填充词,并对文本进行润色。转录文本下

Deepgram 语音识别与语音理解平台AI音频

Deepgram 语音识别与语音理解平台

Deepgram 是面向开发者与企业的云端语音识别与语音理解平台,提供高精度、多语言、低延迟的语音转文字与语音分析能力,可通过 API 快速集成到各类应用中。

TurboScribe AI 智能转录与字幕生成工具AI音频

TurboScribe AI 智能转录与字幕生成工具

TurboScribe 是一款支持多语言、长时音视频转写与字幕生成的在线工具,提供高精度文字转录、字幕导出与翻译功能,适合播客主、自媒体创作者、教育机构和企业会议记录等多种场景。

微软推出三款全新基础AI模型,挑战竞争对手AI资讯

微软推出三款全新基础AI模型,挑战竞争对手

微软AI研究实验室于周四宣布推出三款基础AI模型,分别支持文本、语音和图像生成。这一发布标志着微软在构建多模态AI模型体系上的持续努力,旨在与其他AI实验室竞争,尽管微软仍与OpenAI保持合作关系。 其中,MAI-Transcribe-1支持25种语言的语音转文本,速度是微软Azure Fast的2.5倍。MAI-Voice-1是一款音频生成模型,能够在一秒内生成60秒的音频,并支持用户定制个性

Deepgram 语音识别与语音理解平台AI音频

Deepgram 语音识别与语音理解平台

Deepgram 是面向开发者和企业的云端语音识别与语音理解平台,提供高精度实时与离线转写、语义分析、多语言支持和灵活 API,适用于客服质检、会议记录、语音助手等多种场景。

讯飞译制:AI视频字幕制作与翻译软件AI音频

讯飞译制:AI视频字幕制作与翻译软件

讯飞译制是一款基于科大讯飞语音识别与翻译技术的AI视频字幕制作软件,可自动识别语音生成字幕、智能匹配时间轴,并支持多语种视频翻译与多种字幕格式导出,适合自媒体、教育培训、企业宣传等多种场景。