美国ElevenLabs公司与美国IBM于3月25日宣布合作,将ElevenLabs的语音识别(Speech-to-Text)和语音合成(Text-to-Speech)技术整合到IBM的AI代理产品“watsonx Orchestrate”中。此次合作旨在帮助客户在满足企业安全性和可扩展性需求的同时,提升由AI代理驱动的用户体验,提供更加丰富自然的语音交互工具。
语音作为AI代理与客户及员工沟通的重要媒介,过去常因长时间等待、缺乏灵活的通话流程以及机械化的语音表现而影响用户体验。通过整合ElevenLabs高质量的语音合成技术,watsonx Orchestrate能够支持70种语言,实现带有人类语音细微差别、情感和节奏的清晰自然交流,打造注重安全和合规的语音交互代理。
此次整合使AI代理从文本为主的交互扩展到以语音为先的对话模式,帮助组织提供更有效且以人为中心的AI体验。以日本政府机构和公共服务为例,医疗、福利、教育及市民活动等领域需要支持多语言服务,ElevenLabs的技术使AI电话代理能够使用多种地区口音和声线,在70种语言中流畅交流。此外,银行、保险、医疗服务和公共事业等行业也能借助该技术,在客户支持、销售、员工体验及内部运营等关键场景中覆盖更多社区。
IBM watsonx Orchestrate是一个集成平台,支持客户构建、部署、管理和控制自动化业务流程的AI代理。它能够连接现有系统、模型和自动化工具,实现代理间协作,提供具备可靠性和可解释性的企业级AI可扩展基础。
通过此次整合,使用IBM watsonx Orchestrate构建代理的客户可访问ElevenLabs提供的高质量语音及超过一万个丰富的语音库。同时,平台支持符合PCI标准的安全支付处理、符合HIPAA标准的数据处理的零保留模式以及数据驻留等企业级保护功能。这些功能组合增强了企业级部署所需的一致性、安全性和可靠性,支持全球用户基础的高流量和高并发对话。
ElevenLabs与IBM表示,将继续合作,帮助企业从仅支持文本的代理转向具备扩展性的、面向企业设计的以语音为先且以人为中心的AI体验。


