Anthropic于周二发布了其最新模型Fable,定位为其强大且备受关注的网络安全模型Mythos的公开且有限版本。

然而,并非所有人都对这些限制感到满意,许多网络安全研究人员和专业人士在网上表达了他们的抱怨。

知名安全研究员、IBM X-Force成员Valentina “Chompie” Palmiotti表示:“Fable会拒绝任何可能与网络安全相关的请求,甚至是阅读博客文章这样无害的任务。”

当触发其限制措施时,Fable会暂停对话,并提示“安全措施标记了此消息,涉及网络安全或生物学话题。”

这些限制旨在降低Fable被用于开发恶意软件或破坏软件的风险——这是Anthropic长期关注的问题。对生物学领域的限制则源于对生物武器开发的类似担忧。

今年四月,Anthropic发布Mythos时,仅向有限的公司和组织开放,称之为“Project Glasswing”,旨在利用该模型保护关键软件和基础设施。上周,Anthropic将Mythos的访问权限扩大到15个国家的数百个组织。

尽管出于良好意图,许多网络安全专家仍对这些限制的随意性表示不满。网络安全资深人士Matt Suiche告诉TechCrunch:“如果你让它编写安全代码,它会认为这是网络安全相关工作,而非软件工程最佳实践,结果会被降级。”Fable在触发限制时会回退到Claude Opus 4.8版本。“这似乎是基于关键词,只要涉及‘网络安全’领域的词汇,就会触发限制。”

Suiche是AI网络安全初创公司Tolmo的技术团队成员,他表示:“这可以理解,因为我们还处于早期阶段,他们仍在调整限制措施。我相信随着Anthropic和其他前沿模型公司与新一代网络安全公司合作的加深,这些限制会逐步完善。发布时宁可多限制一些人,也不愿放松限制过早。”

另一位研究人员在社交平台X上抱怨称,“甚至请求代码审查也会触发Fable的限制。”

Anthropic尚未对置评请求作出回应。

除了模型内部的限制外,Anthropic还要求网络安全专业人士申请“网络验证计划”,获得批准后,申请者在使用Claude进行网络安全工作时限制较少。OpenAI也有类似的计划,称为“网络可信访问”。