Anthropic近日宣布,为了遵守美国政府的命令,公司将下线其AI模型Claude Fable 5。这一前所未有的事件成为Anthropic与特朗普政府之间的最新冲突点。公司表示,政府要求暂停向“任何外国国籍人员,无论是在美国境内还是境外,包括Anthropic的外国员工”提供访问权限,但Anthropic为了确保合规,已对所有客户停止了访问权限。
今年早些时候,特朗普政府的国防部将Anthropic列为“供应链风险”,原因是该公司试图限制美国军方对其技术的使用。这一认定实际上禁止了政府机构及其承包商使用Anthropic的技术。对此,Anthropic提起了针对特朗普政府的诉讼。
周二,Anthropic公开发布了Claude Fable 5,这是基于公司Mythos AI模型的版本,内置了防护措施,防止其回答有关网络安全、生物学和化学的问题。公开发布之前,Mythos Preview AI模型在四月进行了有限的试用。该项目旨在让企业和组织利用其强大的网络安全能力提升防御,同时缓解技术可能被恶意利用开发强大黑客工具的担忧。
周五,Anthropic在博客中透露,公司于美国东部时间下午5:21收到了政府的信函。信中未具体说明国家安全方面的担忧。Anthropic表示:“我们了解到政府认为有人发现了绕过或‘越狱’Fable 5的方法。”公司审查了该技术的演示,发现其利用了一些之前已知的、较小的漏洞。这些漏洞相对简单,且其他公开模型也能发现,无需绕过措施。

公司在博客中强调,已实施强有力的防护措施以降低Claude Fable 5被滥用的风险。Anthropic还称,政府发现的越狱方法范围有限,不会使攻击者比使用其他AI模型时更具威胁性。
“迄今为止,政府仅口头提供了一个潜在的、范围有限的非通用越狱证据,基本上是让模型读取特定代码库并修复软件缺陷,”公司写道,“我们了解到政府收到了一个潜在的越狱案例。”
白宫和美国商务部发言人尚未对WIRED的置评请求作出回应。
Anthropic首席执行官达里奥·阿莫代(Dario Amodei)本周早些时候在一篇政策文章中表示,他和公司支持一个公平、结构化且透明的政府流程,以阻止不安全AI模型的发布。Anthropic在周五的博客中则指出,“此次行动并不符合这些原则。”

