随着AI代理技术的发展,安全防御的重点正从传统的“针对人类攻击”转向“针对AI代理”的防护。美国思科系统(Cisco Systems)、美国帕洛阿尔托网络(Palo Alto Networks)、美国微软(Microsoft)等公司,均在2026年3月23日举办的安全大会“RSA Conference 2026”上,介绍了各自在企业内部安全使用AI代理的防御策略和产品。AI代理能够自主执行任务,并与各种工具和服务交互,本文将解析各大厂商在应对这类代理时的不同安全策略。

安全边界从“网络”转向“意图”

思科在3月23日发布的安全博客中指出:“AI代理以机器速度执行复杂任务,但缺乏人类必需的判断力和上下文理解能力。”这凸显了新型安全防护的必要性。传统基于静态网络的安全模型,无法应对能够自主改变行为的AI代理。虽然零信任原则被广泛推崇,但思科认为传统零信任仍不足以应对当前挑战。

原因包括:AI代理仍处于初期阶段,其生态系统分散且不完整;现有安全措施分布于多个服务层,缺乏统一性;代理行为动态且难以预测,静态防御难以奏效。

思科提出了以“代理的意图”为新的安全边界的理念,并于同日发布了名为“DefenseClaw”的框架。思科AI软件与平台高级副总裁DJ Sampath表示,虽然已有如“Skill Scanner”这样的开源工具用于检测OpenClaw技能,但缺少实际运营层面的解决方案,DefenseClaw正是填补这一空白。

DefenseClaw构建于美国英伟达(NVIDIA)提供的基础设施沙箱“OpenShell”之上,作为针对AI代理治理的运营层。其机制不再信任传统网关的一次性授权,而是在执行循环中实时检查所有消息。

DefenseClaw包含多种工具,如“skill-scanner”、“mcp-scanner”、“a2a-scanner”、“CodeGuard静态分析”和“AI BOM(部件清单)生成器”。其中,a2a-scanner监控AI代理间高速且非人类语言的交互;CodeGuard静态分析则对AI生成代码进行漏洞和后门检测。

当检测到禁止行为时,DefenseClaw会在2秒内撤销沙箱权限、隔离文件并拒绝所有连接,形成对AI执行循环的物理防护墙。

下一篇将继续探讨“生命周期管理”及“与人类相同的管理”策略。