日本国家野村综合研究所(NRI)于27日宣布,在日本经济产业省及国立研究开发法人新能源·产业技术综合开发机构(NEDO)支持的生成式AI开发力强化项目“GENIAC(Generative AI Accelerator Challenge)”第三期(2025年8月至2026年3月)中,成功提升了针对特定行业和任务的大型语言模型(LLM)的构建方法的精度与效率。

NRI将该LLM集成到AI代理系统中,并在金融行业的多个业务场景中进行了验证,结果显示其性能均优于OpenAI开发的搭载ChatGPT的商用大型模型“GPT-5.2”。NRI计划利用这一成果,推动AI代理在多行业企业的专业业务支持应用。

通用生成式AI模型虽适用于广泛业务,但难以满足特定行业所需的专业知识、独特术语及法规要求。企业实际业务中,常需依据法律和指南做出专业判断,因此需要针对行业和任务优化的模型及AI代理来提供支持。

为解决上述挑战,NRI独立研发了低成本且高精度的“行业与任务专用LLM”构建方法。在GENIAC第三期中,基于此前研究成果,进一步开发了新构建技术。

该方法采用公开的大型语言模型作为基础模型,避免了对特定模型的依赖,可根据目标和业务灵活选择最适合的模型,并支持未来模型的更新。

本次选用了多款基础性能优异的中型公开模型,通过追加训练赋予其更专业的知识,验证其能否高精度处理业务流程。同时,通过模型压缩技术,实现了在计算资源有限的环境下运行,且压缩后精度无显著下降。

此外,NRI构建了两阶段机制以向基础模型注入特定行业知识。第一阶段自动收集并筛选包含行业知识的大量文本数据,使模型掌握专业知识;第二阶段利用高性能LLM自动生成符合业务需求的问答数据,提升模型响应准确度。该机制使得无论行业为何,都能轻松构建具备专业知识且能准确回答问题的行业专用模型。此次以金融行业为例,构建的模型在金融知识理解的标准测试中表现优于基础模型。

针对特定业务的训练数据,NRI同样开发了利用LLM自动生成的机制。只需少量业务样本和业务定义,即可轻松生成训练数据。以证券和保险多个实际业务为例,验证结果显示NRI构建的专用模型均优于商用大型模型GPT-5.2。

在模型验证阶段,NRI将专用模型集成至能够自主执行多步骤任务的AI代理系统中,并在模拟实际业务流程的环境下进行测试,确认AI能作为业务流程的一部分辅助决策。

NRI已于2026年3月在语言处理学会第32届年会(NLP2026)发布部分研究成果,并在Hugging Face平台公开了构建的行业专用模型及训练数据。未来,NRI将推动集成行业与任务专用模型的AI代理在企业专业业务流程中的应用与推广。该构建方法不仅适用于金融行业,还将扩展至更多行业和业务领域,促进AI在专业领域的深入应用,弥补通用模型难以覆盖的专业需求。