AI资讯微软开源前沿语音AI系列VibeVoice:一次处理90分钟多说话人对话,GitHub迅速获27K星
微软发布了支持自动语音识别和文本转语音的VibeVoice语音AI模型,具备长音频处理、多说话人对话生成和实时低延迟等特性,已在GitHub获得27K星。该项目采用MIT许可证,支持本地部署,无需云服务费用,推动语音合成领域创新。
按标签聚合查看文章内容。
AI资讯微软发布了支持自动语音识别和文本转语音的VibeVoice语音AI模型,具备长音频处理、多说话人对话生成和实时低延迟等特性,已在GitHub获得27K星。该项目采用MIT许可证,支持本地部署,无需云服务费用,推动语音合成领域创新。
AI商业WellSaid 是一款面向团队与企业的专业级 AI 文本转语音平台,提供 120+ 拟真人声、全商用版权、SOC2 与 GDPR 合规及闭环安全模型,帮助快速制作高质量配音、培训与产品语音内容。
AI视频CAMB.AI 是一站式 AI 本地化平台,支持 150+ 语言的配音、翻译与字幕生成,为内容、娱乐与体育行业提供高质量语音合成和多语种分发能力。
AI商业Voxify 是一款专业 AI 语音生成器,提供 500+ 声音、120+ 语言与口音选择,可精细调节音高、语速与情感,适合内容创作者、播客主与教育工作者快速生成高质量配音。
AI音频音秘 AudioMyst 是一款免费的播客创作工具,支持多格式文本转超拟人对话音频、自动生成播客脚本、音色克隆与背景音乐添加,帮助创作者快速制作高质量播客节目。
AI音频Listnr AI 是一款专业级在线 AI 语音生成与文本转语音工具,支持 142+ 种语言和口音、1000+ 自然语音,并可克隆个人声音,适用于短视频、播客、有声书、游戏配音及各类商业视频。
AI商业Murf AI 是一款在线AI语音生成与文本转语音平台,提供高保真配音、AI配音工作室、极速语音API与AI配音翻译功能,适用于播客、有声书、视频解说、客服语音机器人等多种场景。
AI音频LOVO 是一款屡获大奖的在线 AI 配音与文本转语音工具,内置 500+ 高质量声音、支持 100 种语言,并集成在线视频编辑功能,可用于营销视频、播客、有声书、电商短视频、培训课程等多种场景。
AI商业Unreal Speech 是一款专注“极致性价比”的文本转语音(TTS)API 服务,支持多语言、多声音角色、长时音频生成与流式播放,可在约 300ms 内开始输出音频,并提供逐词时间戳,适合大规模生产环境与成本敏感型应用。
AI音频Murf AI 是一款面向创作者和开发者的在线AI配音与文本转语音平台,提供高保真拟真人声、专业配音工作室以及高速TTS API,可用于播客、有声书、视频配音与智能语音客服等多种场景。