AI语音识别示意图

Parakeet公司发布了其说话人识别模型“Parakeet”的演示版本,该模型能够从未经授权学习的AI语音中识别出原始说话人的声音。在这个演示版本中,用户上传音频文件后,系统会预测并分析与上传声音最相近的说话人。

目前,在日本,许多声优的声音被未经许可地用于训练AI模型,且基于这些模型生成的AI合成语音数据在社交媒体上广泛传播。这些行为已超出个人娱乐的范畴,涉及非法分发和公开,成为社会关注的问题。针对这一现状,Parakeet开发了该模型,旨在为识别原始声音所有者提供线索。

该演示版本支持上传不超过30秒的音频文件,系统会从说话人数据库中预测出与上传声音最相似的前三名说话人,并以相似度分数形式展示结果。上传的音频文件不会被服务器保存,保障用户隐私。

Parakeet公司强调,该演示版本仅供参考,不能作为法律判断的依据。由于识别准确率尚未达到完美,未来公司将持续改进该模型的性能。