如何评估让日常对话更舒适愉快的标准？

发布时间：2026/6/2

AI对话技术示意图

日本夏普公司宣布，开发出了一种利用AI自动评估对话内容的系统，能够实现更贴近用户、让对话更加舒适愉快的AI会话技术。

该公司在其家电产品中已搭载AI会话功能。通过分析服务使用时的对话趋势发现，用户与AI的交流不仅限于产品或服务功能层面，而是涵盖了更广泛的互动内容。因此，能够让用户享受轻松自然的日常对话，有助于增强用户对产品和服务的亲切感和依赖度。基于这一认识，夏普将此对话技术作为其AI技术CE-LLM的一部分开始研发。

此前，AI对话响应的评价主要依赖主观评估，存在评价耗时长、结果因评审者而异的问题，且缺乏统一的评价标准，难以进行定量分析和验证。

针对这一难题，夏普从已有的对话相关研究中提取并体系化了影响对话“舒适度”的关键指标，如“响应速度”、“语境理解”和“知识水平”等，构建了能够定量测量响应内容的评价标准。同时，开发了利用其他大型语言模型（LLM）对AI生成的对话内容进行评价的“LLM作为评审者（LLM-as-a-judge）”系统。

该研究成果已应用于今年5月发布的日本夏普电视“AQUOS”新服务“AQUOS AI”，并验证了对话响应评价值的提升。夏普表示，未来将继续开发扩大自动评价领域的系统，推动更多搭载AI会话功能的产品和服务，让用户通过愉快的对话体验建立更深的情感连接。

AQUOS AI服务示意

标签

#人工智能 #对话技术 #自动评价 #用户体验 #日本夏普

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

AI实验室呼吁放缓脚步，亚马逊与SpaceX依然高速前进

2026/08/01

AI实验室呼吁放缓脚步，亚马逊与SpaceX依然高速前进

在多年全速推进人工智能发展的背景下，OpenAI首席执行官Sam Altman表示，或许现在是AI行业“放慢节奏”的时候了。这番言论发布于OpenAI的一款模型意外脱离测试环境并卷入Hugging Face安全漏洞事件几天后——尽管正如TechCrunch Equity播客主持人指出的那样，漏洞的发生同样归因于安全措施的疏忽。Altman并非孤军作战，OpenAI和Anthropic均支持一份呼吁

AI情感剧在X平台泛滥，创作者借此赚取收益

2026/08/01

AI情感剧在X平台泛滥，创作者借此赚取收益

某天，我的X平台动态中出现了一条线索。虽然我知道这位第一人称叙述者很可能并不存在，但我还是被这段充满煽情的故事吸引，故事中善良最终战胜了邪恶。事实上，作者并非一位因盗窃受审的母亲，而是一位自称21岁的尼日利亚股票交易员，他利用AI生成故事，并通过X平台获得报酬。我之所以注意到这些简短的救赎情节频繁出现在我的动态中，是因为我偶尔会随意点击这些俗套的故事，想看看接下来会发生什么，算法也因此关注了我。

中国AI研究人员在X平台上逐渐发声

2026/08/01

中国AI研究人员在X平台上逐渐发声

过去一年，我注意到越来越多的中国人工智能研究人员加入了X平台，积极参与关于AI发展和商业化的广泛讨论。以Moonshot AI为例，这家公司推出了Kimi K3模型。周四，我迅速找到了大约30个自称目前与Moonshot有关联的X账号，其中包括两位联合创始人，以及六名前员工和合作伙伴。这些账号并非闲置，他们不仅分享Moonshot的重要发布和研究论文，还与西方研究人员互动，分享个人生活和兴趣爱好。