Anthropic的安全警告或适得其反——美国政府关闭其最强AI模型

美国政府于周五下令Anthropic立即关闭其两款最强大的AI模型——Claude Fable 5和Claude Mythos 5，理由是国家安全考虑。Anthropic在社交平台X上宣布已遵从该命令，但同时明确表示认为政府此举是错误的判断。

Anthropic表示，该指令于周五下午5:21（东部时间）收到，要求公司对全球所有用户禁用这两款模型，而不仅仅是针对政府出口管制令中提及的外国用户。Anthropic的其他模型访问不受影响。

为何此事如此重要？Mythos是Anthropic最强大的AI模型，公司在四月初曾预览过该模型，并一直严格限制其使用，原因是Mythos在发现软件安全漏洞方面表现出色。Anthropic称，Mythos在测试的所有主流操作系统和网页浏览器中均发现了漏洞。出于安全考虑，公司没有广泛发布该模型，而是启动了名为Project Glasswing的受控项目，将其分享给约50个经过审核的组织，包括亚马逊、苹果、谷歌、微软和CrowdStrike，用于防御性网络安全工作。

三天前发布的Fable 5是Anthropic应对商业压力的产物：它是在Mythos基础上加装了安全防护措施，阻止在网络安全和生物学等高风险领域的回答，确保模型足够安全以供公众使用。根据Vals AI的基准测试，Fable 5立即成为公开可用的最强AI模型。

Anthropic模型性能截图

政府的指令被表述为出口管制措施，限制外国用户访问这些模型。但Anthropic在一篇详细博客中表示，其理解的核心问题是Fable 5被“潜在的有限绕过”所影响。公司称，政府目前仅提供了口头证据，显示存在一种“潜在的有限、非普遍绕过”，即通过特定提示让模型读取代码库并识别软件漏洞。Anthropic补充说，这种能力在其他公开模型（包括OpenAI的GPT-5.5）中已广泛存在，且网络安全专家常用于防御性工作。

Anthropic进一步解释，其最强的安全防护是通过独立的分类器系统实现的，这些系统独立于模型本身运行，即使有人成功让Fable绕过拒绝回答，最危险内容的保护机制依然有效。

显然，这些解释未能阻止政府采取行动，Anthropic对此表达了明显的不满。公司写道：“我们不同意仅凭有限的潜在绕过就召回一款已向数亿用户部署的商业模型。如果这一标准在行业内普遍适用，我们认为这将基本停止所有领先模型提供商的新模型部署。”

Anthropic预计今年将进行首次公开募股（IPO），并将自己定位为比竞争对手更注重安全的AI公司。讽刺的是，Anthropic对Mythos的严格限制——将其宣传为危险到不能公开发布的模型——正是引发政府高度关注、可能严重影响其业务的原因。

至少OpenAI的Sam Altman对此应感到欣慰。今年四月，他在接受播客主持人Ashlee Vance采访时称Anthropic对Mythos的处理是“基于恐惧的营销”。他说：“声称‘我们造了一颗炸弹，准备扔到你头上，然后卖你一个价值一亿美元的防爆避难所’显然是极具营销效果的说法。”Altman的公司也被广泛认为将尽快进行IPO。他虽然未预见到政府会关闭模型，但指出Anthropic花费数月时间宣称其AI极具危险性，结果导致包括美国政府在内的各方高度关注，这最终反噬了Anthropic。

Anthropic的安全警告或适得其反——美国政府关闭其最强AI模型

标签

评论

相关阅读

AI实验室呼吁放缓脚步，亚马逊与SpaceX依然高速前进

AI情感剧在X平台泛滥，创作者借此赚取收益

中国AI研究人员在X平台上逐渐发声