#语音识别

按标签聚合查看文章内容。

Deepgram 语音识别与语音理解平台AI音频

Deepgram 语音识别与语音理解平台

Deepgram 是面向开发者与企业的云端语音识别与语音理解平台,提供高精度、多语言、低延迟的语音转文字与语音分析能力,可通过 API 快速集成到各类应用中。

完全本地环境实现AI语音转文字软件“轻松视频与音频AI转写”发布AI资讯

完全本地环境实现AI语音转文字软件“轻松视频与音频AI转写”发布

日本Magnolia株式会社于3月23日推出了一款基于AI语音识别的转写软件——“轻松视频与音频AI转写”。该软件支持Windows 11系统,售价为3980日元,采用一次性购买的下载方式,同时提供15天的免费试用版本。 “轻松视频与音频AI转写”基于OpenAI的语音识别模型“Whisper”,能够在本地环境运行,利用AI判断语境,生成更易读的文本内容。转写结果可保存为TXT文本文件和SRT字

讯飞译制:AI视频字幕制作与翻译软件AI音频

讯飞译制:AI视频字幕制作与翻译软件

讯飞译制是一款基于科大讯飞语音识别与翻译技术的AI视频字幕制作软件,可自动识别语音生成字幕、智能匹配时间轴,并支持多语种视频翻译与多种字幕格式导出,适合自媒体、教育培训、企业宣传等多种场景。