DeepL,这家以文本翻译工具闻名的公司,近日推出了一套语音到语音的翻译解决方案,涵盖会议、移动和网页对话,以及通过定制应用支持一线工作人员的群组交流。与此同时,DeepL还发布了API,允许外部开发者和企业基于其技术打造定制化应用场景,如呼叫中心等。

DeepL首席执行官Jarek Kutylowski在接受采访时表示:“经过多年专注于文本翻译,语音翻译是我们的自然延伸。我们在文本和文档翻译方面取得了长足进步,但发现市场上缺乏优秀的实时语音翻译产品。”

Kutylowski指出,开发实时翻译产品的最大挑战在于如何平衡延迟(即从发声到翻译音频播放的时间差)与翻译准确性。

DeepL推出了适用于Zoom和Microsoft Teams等平台的插件,用户可以在他人使用母语发言时,实时听到翻译音频,或在屏幕上看到实时翻译文本。目前该项目处于早期访问阶段,公司正邀请各组织加入候补名单。除此之外,DeepL还提供支持移动和网页端的对话产品,适用于面对面或远程交流。

此外,DeepL支持通过二维码加入的群组对话,适合培训或研讨会等场景。

DeepL表示,其语音翻译技术能够学习并适应定制词汇,包括行业术语、公司名称及个人名字。

Kutylowski还提到,人工智能正在重新定义未来的客户服务模式。翻译技术为企业提供了在缺乏合格多语言员工的情况下,依然能够提供多语种支持的可能性,降低了人力成本。

DeepL目前掌控整个语音翻译流程,现阶段系统先将语音转换为文本,进行翻译后再转回语音。DeepL认为,凭借多年文本翻译经验,其翻译质量具有优势。未来,公司计划开发端到端的语音翻译模型,跳过文本转换环节。

DeepL面临来自多个资金充足的初创企业的竞争。去年,Sanas获得了Quadrille Capital和Teleperformance投资的6500万美元,利用AI实时调整呼叫中心员工口音。总部位于迪拜的Camb.AI专注于为媒体娱乐公司提供语音合成和翻译,帮助大规模配音和本地化视频内容。由Reddit联合创始人Alexis Ohanian支持的Palabra,正在打造一款实时语音翻译引擎,旨在保留发言者的原声和语义,与DeepL的产品形成直接竞争。