野村综合研究所提升行业与任务专用大型语言模型的构建精度以推动AI代理应用

日本国家野村综合研究所（NRI）于27日宣布，在日本经济产业省及国立研究开发法人新能源·产业技术综合开发机构（NEDO）支持的生成式AI开发力强化项目“GENIAC（Generative AI Accelerator Challenge）”第三期（2025年8月至2026年3月）中，成功提升了针对特定行业和任务的大型语言模型（LLM）的构建方法的精度与效率。

NRI将该LLM集成到AI代理系统中，并在金融行业的多个业务场景中进行了验证，结果显示其性能均优于OpenAI开发的搭载ChatGPT的商用大型模型“GPT-5.2”。NRI计划利用这一成果，推动AI代理在多行业企业的专业业务支持应用。

通用生成式AI模型虽适用于广泛业务，但难以满足特定行业所需的专业知识、独特术语及法规要求。企业实际业务中，常需依据法律和指南做出专业判断，因此需要针对行业和任务优化的模型及AI代理来提供支持。

为解决上述挑战，NRI独立研发了低成本且高精度的“行业与任务专用LLM”构建方法。在GENIAC第三期中，基于此前研究成果，进一步开发了新构建技术。

该方法采用公开的大型语言模型作为基础模型，避免了对特定模型的依赖，可根据目标和业务灵活选择最适合的模型，并支持未来模型的更新。

本次选用了多款基础性能优异的中型公开模型，通过追加训练赋予其更专业的知识，验证其能否高精度处理业务流程。同时，通过模型压缩技术，实现了在计算资源有限的环境下运行，且压缩后精度无显著下降。

此外，NRI构建了两阶段机制以向基础模型注入特定行业知识。第一阶段自动收集并筛选包含行业知识的大量文本数据，使模型掌握专业知识；第二阶段利用高性能LLM自动生成符合业务需求的问答数据，提升模型响应准确度。该机制使得无论行业为何，都能轻松构建具备专业知识且能准确回答问题的行业专用模型。此次以金融行业为例，构建的模型在金融知识理解的标准测试中表现优于基础模型。

针对特定业务的训练数据，NRI同样开发了利用LLM自动生成的机制。只需少量业务样本和业务定义，即可轻松生成训练数据。以证券和保险多个实际业务为例，验证结果显示NRI构建的专用模型均优于商用大型模型GPT-5.2。

在模型验证阶段，NRI将专用模型集成至能够自主执行多步骤任务的AI代理系统中，并在模拟实际业务流程的环境下进行测试，确认AI能作为业务流程的一部分辅助决策。

NRI已于2026年3月在语言处理学会第32届年会（NLP2026）发布部分研究成果，并在Hugging Face平台公开了构建的行业专用模型及训练数据。未来，NRI将推动集成行业与任务专用模型的AI代理在企业专业业务流程中的应用与推广。该构建方法不仅适用于金融行业，还将扩展至更多行业和业务领域，促进AI在专业领域的深入应用，弥补通用模型难以覆盖的专业需求。

野村综合研究所提升行业与任务专用大型语言模型的构建精度以推动AI代理应用

标签

评论

相关阅读

东京大学学生生成式AI使用率达93.4%，匿名问卷应用用户突破500人

Meta新款AI芯片将于九月开始量产

TOPPAN等三家公司推动日本政府共通数据的AI准备化