Anthropic首次向公众开放了其最强大的AI模型,但同时设置了严格的安全防护措施。

本周二,Anthropic推出了Claude Fable 5,这是其Mythos模型的首个公开版本。公司表示,Fable 5在软件工程、知识工作和视觉识别方面表现出色,但在网络安全、生物学、化学等高风险领域会自动屏蔽回答,并切换回Claude Opus 4.8模型。

Mythos模型于今年四月作为预览版首次亮相,最初仅限少数合作伙伴使用,主要是出于网络安全的考虑。上周,Anthropic将Mythos的访问权限扩展到15个国家的数百个关键基础设施管理机构。

现在,基于该技术的版本通过Anthropic的Claude API和按使用量计费的企业计划向所有用户开放。订阅用户可分阶段获得访问权限:6月22日前,Fable 5将免费包含在Pro、Max、Team及基于席位的企业计划中;6月23日起,Fable 5将从这些计划中移除,需使用使用积分,Anthropic计划尽快恢复其作为标准订阅功能。

同时,Anthropic还向已获批准访问高级模型的组织推出了Mythos 5新版本。

此次Fable的发布正值Anthropic准备公开上市之际,与OpenAI和埃隆·马斯克的SpaceX等公司一同进入资本市场。此前,Anthropic曾呼吁全球主要AI实验室联合设立“刹车机制”,以遏制前沿AI技术的过快发展。公司警告称,AI系统进步迅速,可能很快实现递归自我改进(RSI),即无需人类干预即可自主提升自身能力。

鉴于Mythos级模型若落入不当之手可能带来的风险,Anthropic在发布Fable 5前进行了严格的安全测试,包括超过1000小时的外部漏洞赏金测试,未发现通用绕过方法。公司还与外部红队组织合作,亦未发现通用绕过漏洞。

尽管如此,仍可能存在新型攻击手段。为此,Fable 5和Mythos 5发布时,Anthropic要求所有流量数据保留30天,即使此前企业签署了零保留协议。公司承诺不会将数据用于训练,仅用于防御复杂新型攻击(包括新绕过手段)及减少误报。这一政策或将成为行业先例,标志着访问更强大模型需配合强制数据保留以保障安全。

对于持续使用该模型的用户,并非所有请求都会由Fable 5直接回答。Anthropic表示,Fable 5需切换至Opus 4.8的情况较少,初步数据表明至少95%的会话完全由Fable 5响应。

第三方测试中,分析公司Hex表示,Fable在复杂长时分析任务的核心基准测试中首次达到90%的得分,展现出强大的判断力和对细节的关注。

编程平台Base44称Fable在“一次性完成完整应用”及工具调用方面表现优异。AI工作空间和代理平台Genspark表示,Fable在其评估中击败所有其他模型,尤其在用户界面设计和游戏编码任务中表现显著更好。

Fable 5和Mythos 5的定价为每百万输入令牌10美元,每百万输出令牌50美元,是Opus 4.8价格的两倍,这一价格可能限制其广泛使用。

许多企业对AI成本日益敏感,部分原因是账单激增或年度预算提前耗尽。高级模型如Opus 4.8的复杂推理能力可能加剧这一问题,因为它们会将单一请求拆分成多个任务。

Anthropic预计Fable 5的需求将非常高且难以预测。一些企业如购物奖励平台乐天(Rakuten)认为其价值值得这一价格。

乐天表示:“在最高强度的使用下,Fable能够反思并验证自身工作,这使得高度自主的运营成为可能——额外的思考带来了回报。”