深入理解当前不可忽视的“AI治理”

AI治理

为什么“现在”要关注AI治理？

企业风险感知与事件数量激增

生成式AI和AI代理的迅速普及，暴露了企业在信息泄露和社会影响方面的新担忧。许多企业将“信息泄露与安全风险”视为引入生成式AI的最大障碍，这一担忧远超成本和应用场景不足等其他问题。

风险增长

这些担忧的背后，是传统边界型安全无法完全控制的数据流动，员工在AI素养不足的情况下无意中输入机密信息，以及AI开发带来的漏洞增加。经济合作与发展组织（OECD）报告显示，2026年1月AI相关事件报告达到月度435起，呈持续上升趋势。

漏洞风险

在工程师社区，AI开发已成常态，但AI直接引入代码漏洞的风险也在增加。美国国家漏洞数据库（NVD）登记的漏洞数量激增，美国国家标准与技术研究院（NIST）已宣布不再为所有CVE漏洞提供详细信息，仅对符合一定标准的漏洞补充详细资料。

国内外AI治理应对措施

随着全球对AI风险的关注升温，国内外相关应对措施逐渐成型。多份旨在评估安全性和系统化威胁的核心文件陆续发布，形成了AI治理讨论的共识基础。

国际治理

主要文件包括由29国专家参与的《国际AI安全报告2026》，针对AI代理和大型语言模型（LLM）应用的《OWASP 2026年代理应用十大风险》和《OWASP 2025年LLM应用十大风险》。日本信息处理推进机构（IPA）首次将“AI使用相关的网络风险”列入《2026年信息安全十大威胁》，表明AI安全威胁已被官方认可。

与此同时，LLM服务提供商也在加强管理。例如，OpenAI将GPT-5.4-Cyber限定提供给经过验证的组织，Anthropic因担忧滥用风险推迟公开Claude Mythos Preview，并联合AWS、Google、微软等发起跨行业防御计划“Project Glasswing”。

日本自民党也在金融厅、AISI和国家网络统筹室的推动下，开始讨论组建“日本版Project Glasswing”，推动行业向“可信访问”模式转型。

从“原则”到“落地”的转变

《2026 AI指数报告》（HAI）、麦肯锡和安永的调查显示，建立完善治理机制的企业不仅减少了AI事件，还在业务运营优化、客户信任构建和收入增长方面表现突出。治理不再是单纯的合规义务，而是推动AI规模化应用和商业价值转化的关键。

治理成效

麦肯锡调查还发现，AI应用收益显著的企业在“负责任AI”（确保AI安全、公正、透明运行的组织实践）上的投资比例更高。

随着企业风险感知增强、国际风险整理和指南细化，以及LLM提供商加强访问控制，AI治理正从理念和原则阶段迈向组织内部的制度化阶段。

AI治理概述

根据日本总务省和经济产业省发布的《AI事业者指南第1.2版》，AI治理定义为：

在利益相关者可接受的风险水平下管理AI使用带来的风险，同时最大化其正面影响（效益），通过利益相关者设计和运营技术、组织及社会系统。

“治理”本意为“掌舵”，包含三个要素：

有明确目的地——确定方向和目标
了解环境——识别风险和障碍
操控舵盘——根据情况调整决策和控制

治理要素

技术、组织与社会系统的设计与运营

AI安全措施涵盖广泛，不仅包括安全防护和日志监控，还涉及使用指南制定、事件响应流程设计和素养提升等多层次措施，只有这些措施齐备，才能实现“安全且持续可用”的状态。

AI治理即从技术、业务、组织和社会四个视角系统化管理安全要素，促进各利益相关方协作设计和运营。

其基础是以人为本、安全、公平、透明、隐私和安全为核心的“AI原则”，以及基本人权、民主、经济增长和可持续社会等“基本价值”。

治理基础

AI应用带来的风险

AI治理关注的风险主要分为两类：

技术风险：信息泄露、提示注入、幻觉现象、模型退化等，源于AI系统设计、实现和运营的问题。
社会风险：偏见、公平性缺失、知识产权侵害、深度伪造导致的虚假信息传播等，影响社会结构、人权和经济。

理解风险时，关键是结构性地把握其引发的影响，而非单一事件本身。例如“幻觉”并非根本问题，真正关注的是其可能导致的错误决策、客户损害、法律合规负担和品牌损害等经济和人力风险。

风险影响

确保AI系统不对人类和社会造成伤害的研究与措施统称为“AI安全”，是AI治理的基础。国内外相关技术指南逐步完善，如总务省的技术对策指南草案、Japan AISI的评估视角和红队测试方法指南等。

此外，Citadel AI发布的《生成式AI实践指南与企业案例集》基于对20家国内AI企业的调研，系统总结了质量、安全和治理实践，显示AI安全已成为企业自然而然的要求。

在可接受水平管理风险

风险不可能完全消除，随着AI系统更新、使用变化和新威胁出现，风险性质持续变化。关键是持续运转风险管理生命周期，提高组织风险素养。生命周期包括：

风险识别——发现潜在风险
风险评估——定义可接受水平并优先排序
风险缓解——实施优先级措施
风险管理——持续监控管理风险
风险治理——确保利益相关者认知一致，形成规则、流程和组织体系

风险管理

不同产业和应用的风险容忍度不同，需结合自身情况制定风险评估和优先级。欧盟AI法案和日本AI事业者指南均强调基于风险的管理方法。

广泛参考的标准包括ISO/IEC 42001和NIST AI风险管理框架（AI RMF）。ISO/IEC 42001涵盖领导力、数据治理、影响评估和持续监控等要求，株式会社Corpy发布的生成式AI安全评估协议与实施指南与之对应，系统化分析、测试和报告流程。

面对不确定性的反脆弱生命周期

AI系统环境不断变化，模型更新、用户行为变动、新攻击手法和法规调整交织，导致“完成时安全”的系统数月后可能存在意外风险。

单靠预防性设计难以应对，需结合“防止失败”和“在变化中持续成功”的思维。

通过快速、小规模、持续的评估和改进循环，将系统调整至可接受范围，同时关注事故预防（Safety-I）和成功经验的理解与复制（Safety-II）。

这种持续循环的治理方式称为“敏捷治理”。

敏捷治理

敏捷治理的成功依赖于所有相关人员的协作，需早期拆除沟通障碍，形成对责任、验证和学习的共识，并将治理纳入组织战略。

与所有利益相关者对话是AI治理实践的起点

AI事业者指南和NIST AI RMF等框架设计时考虑了“根据企业规模和状况灵活应用”，虽属软法，但为统一组织内外认知提供了共同语言。

重要的是优先聚焦关键事项，综合预算、系统特性、用户需求和风险容忍度，明确投资优先级。

项目启动时无法收集所有需求，且需求几乎总在变化

任务总是超出时间和资金限制

——摘自Jonathan Rasmusson《敏捷武士——成为大师级开发者之路》

因此，与所有利益相关者的持续对话，是AI治理实践的真正起点。

作者简介：宫脇峻平

株式会社Algomatic AI治理中心 AI首席工程师

曾在企业研发和学术界从事研究，现任职于株式会社Algomatic，专注于基于大型语言模型和AI代理的战略设计、产品开发及MLOps构建。著有《现场实用AI代理入门》。

公司官网：https://algomatic.jp/

开发者视角解读AI世界文章列表