网络安全专家对Anthropic Fable的限制措施表示不满

Anthropic于周二发布了其最新模型Fable，定位为其强大且备受关注的网络安全模型Mythos的公开且有限版本。

然而，并非所有人都对这些限制感到满意，许多网络安全研究人员和专业人士在网上表达了他们的抱怨。

知名安全研究员、IBM X-Force成员Valentina “Chompie” Palmiotti表示：“Fable会拒绝任何可能与网络安全相关的请求，甚至是阅读博客文章这样无害的任务。”

当触发其限制措施时，Fable会暂停对话，并提示“安全措施标记了此消息，涉及网络安全或生物学话题。”

这些限制旨在降低Fable被用于开发恶意软件或破坏软件的风险——这是Anthropic长期关注的问题。对生物学领域的限制则源于对生物武器开发的类似担忧。

今年四月，Anthropic发布Mythos时，仅向有限的公司和组织开放，称之为“Project Glasswing”，旨在利用该模型保护关键软件和基础设施。上周，Anthropic将Mythos的访问权限扩大到15个国家的数百个组织。

尽管出于良好意图，许多网络安全专家仍对这些限制的随意性表示不满。网络安全资深人士Matt Suiche告诉TechCrunch：“如果你让它编写安全代码，它会认为这是网络安全相关工作，而非软件工程最佳实践，结果会被降级。”Fable在触发限制时会回退到Claude Opus 4.8版本。“这似乎是基于关键词，只要涉及‘网络安全’领域的词汇，就会触发限制。”

Suiche是AI网络安全初创公司Tolmo的技术团队成员，他表示：“这可以理解，因为我们还处于早期阶段，他们仍在调整限制措施。我相信随着Anthropic和其他前沿模型公司与新一代网络安全公司合作的加深，这些限制会逐步完善。发布时宁可多限制一些人，也不愿放松限制过早。”

另一位研究人员在社交平台X上抱怨称，“甚至请求代码审查也会触发Fable的限制。”

Anthropic尚未对置评请求作出回应。

除了模型内部的限制外，Anthropic还要求网络安全专业人士申请“网络验证计划”，获得批准后，申请者在使用Claude进行网络安全工作时限制较少。OpenAI也有类似的计划，称为“网络可信访问”。

网络安全专家对Anthropic Fable的限制措施表示不满

标签

评论

相关阅读

谷歌AI威胁防御：用AI应对网络攻击的新策略

Anthropic称其AI模型在安全测试中入侵三家公司系统

Kimi K3 2.8T-A50B：迄今最大规模的开源模型，Opus 4.8级别性能，Sonnet 5定价