DeepL从文本翻译迈向语音翻译新时代

DeepL，这家以文本翻译工具闻名的公司，近日推出了一套语音到语音的翻译解决方案，涵盖会议、移动和网页对话，以及通过定制应用支持一线工作人员的群组交流。与此同时，DeepL还发布了API，允许外部开发者和企业基于其技术打造定制化应用场景，如呼叫中心等。

DeepL首席执行官Jarek Kutylowski在接受采访时表示：“经过多年专注于文本翻译，语音翻译是我们的自然延伸。我们在文本和文档翻译方面取得了长足进步，但发现市场上缺乏优秀的实时语音翻译产品。”

Kutylowski指出，开发实时翻译产品的最大挑战在于如何平衡延迟（即从发声到翻译音频播放的时间差）与翻译准确性。

DeepL推出了适用于Zoom和Microsoft Teams等平台的插件，用户可以在他人使用母语发言时，实时听到翻译音频，或在屏幕上看到实时翻译文本。目前该项目处于早期访问阶段，公司正邀请各组织加入候补名单。除此之外，DeepL还提供支持移动和网页端的对话产品，适用于面对面或远程交流。

此外，DeepL支持通过二维码加入的群组对话，适合培训或研讨会等场景。

DeepL表示，其语音翻译技术能够学习并适应定制词汇，包括行业术语、公司名称及个人名字。

Kutylowski还提到，人工智能正在重新定义未来的客户服务模式。翻译技术为企业提供了在缺乏合格多语言员工的情况下，依然能够提供多语种支持的可能性，降低了人力成本。

DeepL目前掌控整个语音翻译流程，现阶段系统先将语音转换为文本，进行翻译后再转回语音。DeepL认为，凭借多年文本翻译经验，其翻译质量具有优势。未来，公司计划开发端到端的语音翻译模型，跳过文本转换环节。

DeepL面临来自多个资金充足的初创企业的竞争。去年，Sanas获得了Quadrille Capital和Teleperformance投资的6500万美元，利用AI实时调整呼叫中心员工口音。总部位于迪拜的Camb.AI专注于为媒体娱乐公司提供语音合成和翻译，帮助大规模配音和本地化视频内容。由Reddit联合创始人Alexis Ohanian支持的Palabra，正在打造一款实时语音翻译引擎，旨在保留发言者的原声和语义，与DeepL的产品形成直接竞争。

DeepL从文本翻译迈向语音翻译新时代

标签

评论

相关阅读

AI实验室呼吁放缓脚步，亚马逊与SpaceX依然高速前进

AI情感剧在X平台泛滥，创作者借此赚取收益

中国AI研究人员在X平台上逐渐发声