“危险”人工智能模型无可避免地将出现

自今年四月 Mythos 发布以来，Anthropic 公司一直声称并警告，该模型不仅具备发现软件漏洞以帮助防御者修补的高级能力，还能找出被恶意行为者利用的漏洞利用方法。Anthropic 在推出 Mythos 5 和 Claude Fable 5 时特别指出了这一双刃剑效应。“人工智能模型的许多高级用途具有双重性质：同样的查询在网络安全专家和生物学研究人员手中是有益的，但如果落入恶意行为者手中则可能非常危险，”公司在上周的一篇博客中写道。

基于此，Anthropic 最初向一个名为 Project Glasswing 的工作组中的精选联盟发布了 Mythos Preview 版本。Mythos 5 也于上周私下提供给该工作组，而 Claude Fable 5（一个与 Mythos 级别相当的模型）则向公众发布，但对其回答生物学和网络安全相关问题的能力进行了特定限制。

然而，上周末，美国特朗普政府决定限制这两款模型的使用，理由是 Fable 5 的安全防护措施可能被关闭，从而允许完全访问 Mythos 5 的能力，涉嫌构成国家安全风险。

专家指出，这场制度层面的冲突不过是在延缓或掩盖一个严峻的事实：Anthropic 可能是当前的先驱，但整体来看，人工智能能力以及来自多家公司和开源开发者的模型几乎肯定会在不久的将来具备与 Mythos 5 类似的能力——如果他们还没有的话。

专门从事网络安全咨询的 TPO Group 首席安全官 Tarah Wheeler 表示：“认为没有其他竞争者会开发出类似 Mythos 的能力，甚至认为他们还没有这么做，是极其短视的。还有其他公司紧随 Anthropic 之后，可能也具备这些能力，只是他们在观察 Anthropic 在当前监管环境下的遭遇，暂时将这些能力保留着。”

Anthropic 自 Mythos Preview 发布以来也一直强调这一点。公司前沿红队负责人 Logan Graham 在四月接受 WIRED 采访时表示：“真正的信息是，这不仅仅关乎某个模型或 Anthropic 公司。我们需要为一个这些能力将在6、12、24个月内广泛普及的世界做好准备。”

例如，OpenAI 也在四月中旬私下发布了一个专注于网络安全的模型，并宣布了扩展的网络安全战略。

研究人员指出，即使在下一代模型出现之前，现有的人工智能产品经过精细调整，也能用于高级漏洞挖掘和漏洞利用开发。大量网络安全领导者在周日给政府的一封公开信中强调，白宫的出口管制指令存在误导。

哈佛大学和多伦多大学研究员 Bruce Schneier 说：“这不是某一个模型的问题，而是技术发展的总体趋势。更小、更便宜的开源模型，有时单独使用，有时协同工作，通过更复杂的提示，能够达到 Mythos/Fable 的表现。我们应该预期其他模型在数月内会达到 Mythos/Fable 的创造力和韧性——开源模型可能需要稍长时间。”

专家们认为，白宫和全球各国政府需要关注的是，如何以民主和更透明的方式制定更广泛的计划，来应对人工智能在网络安全及其他敏感领域能力不可避免的进步。

云安全公司 Veracode 联合创始人 Chris Wysopal 表示：“政策问题不是技术是否存在风险，而是具体的限制措施是否真正降低了风险，还是仅仅拖慢了那些试图让系统更安全的人的步伐。”

“危险”人工智能模型无可避免地将出现

标签

评论

相关阅读

利用自律行走机器人与AI的“全自动点检机器人套餐”服务

GitHub Copilot全计划将改为按使用量计费模式

Meta AI推出采用新模型「Muse Spark 1.1」的服务