【海外科技观察】AI安全防御从“人对人”转向“人对AI代理”

随着AI代理技术的发展，安全防御的重点正从传统的“针对人类攻击”转向“针对AI代理”的防护。美国思科系统（Cisco Systems）、美国帕洛阿尔托网络（Palo Alto Networks）、美国微软（Microsoft）等公司，均在2026年3月23日举办的安全大会“RSA Conference 2026”上，介绍了各自在企业内部安全使用AI代理的防御策略和产品。AI代理能够自主执行任务，并与各种工具和服务交互，本文将解析各大厂商在应对这类代理时的不同安全策略。

安全边界从“网络”转向“意图”

思科在3月23日发布的安全博客中指出：“AI代理以机器速度执行复杂任务，但缺乏人类必需的判断力和上下文理解能力。”这凸显了新型安全防护的必要性。传统基于静态网络的安全模型，无法应对能够自主改变行为的AI代理。虽然零信任原则被广泛推崇，但思科认为传统零信任仍不足以应对当前挑战。

原因包括：AI代理仍处于初期阶段，其生态系统分散且不完整；现有安全措施分布于多个服务层，缺乏统一性；代理行为动态且难以预测，静态防御难以奏效。

思科提出了以“代理的意图”为新的安全边界的理念，并于同日发布了名为“DefenseClaw”的框架。思科AI软件与平台高级副总裁DJ Sampath表示，虽然已有如“Skill Scanner”这样的开源工具用于检测OpenClaw技能，但缺少实际运营层面的解决方案，DefenseClaw正是填补这一空白。

DefenseClaw构建于美国英伟达（NVIDIA）提供的基础设施沙箱“OpenShell”之上，作为针对AI代理治理的运营层。其机制不再信任传统网关的一次性授权，而是在执行循环中实时检查所有消息。

DefenseClaw包含多种工具，如“skill-scanner”、“mcp-scanner”、“a2a-scanner”、“CodeGuard静态分析”和“AI BOM（部件清单）生成器”。其中，a2a-scanner监控AI代理间高速且非人类语言的交互；CodeGuard静态分析则对AI生成代码进行漏洞和后门检测。

当检测到禁止行为时，DefenseClaw会在2秒内撤销沙箱权限、隔离文件并拒绝所有连接，形成对AI执行循环的物理防护墙。

下一篇将继续探讨“生命周期管理”及“与人类相同的管理”策略。

【海外科技观察】AI安全防御从“人对人”转向“人对AI代理”

安全边界从“网络”转向“意图”

标签

评论

相关阅读

TechCrunch出行：汽车行业的AI技能竞赛即将来临

日本TISI与AtStream Consulting发布面向系统规划构想流程的AI代理实证成果

微软Copilot AI被曝一键泄露2FA验证码，助黑客窃取账户