AI资讯微软开源前沿语音AI系列VibeVoice:一次处理90分钟多说话人对话,GitHub迅速获27K星
微软发布了支持自动语音识别和文本转语音的VibeVoice语音AI模型,具备长音频处理、多说话人对话生成和实时低延迟等特性,已在GitHub获得27K星。该项目采用MIT许可证,支持本地部署,无需云服务费用,推动语音合成领域创新。
按标签聚合查看文章内容。
AI资讯微软发布了支持自动语音识别和文本转语音的VibeVoice语音AI模型,具备长音频处理、多说话人对话生成和实时低延迟等特性,已在GitHub获得27K星。该项目采用MIT许可证,支持本地部署,无需云服务费用,推动语音合成领域创新。