AI对话技术示意图

日本夏普公司宣布,开发出了一种利用AI自动评估对话内容的系统,能够实现更贴近用户、让对话更加舒适愉快的AI会话技术。

该公司在其家电产品中已搭载AI会话功能。通过分析服务使用时的对话趋势发现,用户与AI的交流不仅限于产品或服务功能层面,而是涵盖了更广泛的互动内容。因此,能够让用户享受轻松自然的日常对话,有助于增强用户对产品和服务的亲切感和依赖度。基于这一认识,夏普将此对话技术作为其AI技术CE-LLM的一部分开始研发。

此前,AI对话响应的评价主要依赖主观评估,存在评价耗时长、结果因评审者而异的问题,且缺乏统一的评价标准,难以进行定量分析和验证。

针对这一难题,夏普从已有的对话相关研究中提取并体系化了影响对话“舒适度”的关键指标,如“响应速度”、“语境理解”和“知识水平”等,构建了能够定量测量响应内容的评价标准。同时,开发了利用其他大型语言模型(LLM)对AI生成的对话内容进行评价的“LLM作为评审者(LLM-as-a-judge)”系统。

该研究成果已应用于今年5月发布的日本夏普电视“AQUOS”新服务“AQUOS AI”,并验证了对话响应评价值的提升。夏普表示,未来将继续开发扩大自动评价领域的系统,推动更多搭载AI会话功能的产品和服务,让用户通过愉快的对话体验建立更深的情感连接。

AQUOS AI服务示意