Anthropic首次向公众开放了其最强大的AI模型,但同时设置了严格的安全限制。

周二,该公司发布了Claude Fable 5,这是其Mythos模型的首个公开版本。Anthropic表示,Fable 5在软件工程、知识工作和视觉任务上表现出色,但在网络安全、生物学、化学等高风险领域会自动屏蔽响应,并切换到Claude Opus 4.8模型。

Mythos模型最初于4月作为预览版推出,仅限少数合作伙伴使用,主要是出于网络安全考虑。上周,Anthropic将访问权限扩大到15个国家的数百个关键基础设施管理组织。

现在,任何人都可以通过Anthropic的Claude API和基于使用量的企业计划访问该技术。订阅用户将在6月22日前免费获得Fable 5,涵盖Pro、Max、Team及基于席位的企业计划。6月23日起,Fable 5将从这些计划中移除,转为使用积分计费,Anthropic计划尽快恢复其作为标准订阅功能。

同时,Anthropic还向已获批准的组织部署了新版本Mythos 5。

Fable的发布正值Anthropic准备公开上市之际,与OpenAI和埃隆·马斯克的SpaceX一同进入资本市场。此前,Anthropic曾呼吁全球主要AI实验室联合设立“刹车机制”,以应对前沿AI技术的快速发展,警告系统可能很快实现递归自我改进(RSI),即无需人类干预即可自主提升性能。

鉴于Mythos级模型若落入不当之手可能带来的风险,Anthropic在发布Fable 5前进行了严格的安全测试,包括超过1000小时的外部漏洞赏金测试,未发现通用绕过方法。随后与外部红队组织合作,也未能找到通用绕过手段。

尽管如此,仍可能出现新的攻击方式。因此,Fable 5和Mythos 5上线后,Anthropic要求所有流量数据保留30天,即使之前企业协议为零保留。公司承诺不将数据用于训练,仅用于防御复杂新型攻击(包括新绕过手段)及减少误报。这一政策或将成为行业先例,强制数据保留作为安全措施与强大模型访问挂钩。

使用者并非所有请求都会由Fable 5直接回答,Anthropic表示Fable 5需切换至Opus 4.8的情况很少,早期数据显示至少95%的会话完全由Fable 5响应。

第三方测试中,分析公司Hex称Fable首次在复杂长时分析任务的核心基准测试中获得90%分数,表现出强大的判断力和细节关注。

编程平台Base44指出,Fable在“一次性完成完整应用”及工具调用方面表现优异。AI工作空间和代理平台Genspark评价Fable在UI设计和游戏编码等任务中胜过所有其他模型。

Fable 5和Mythos 5的定价为每百万输入令牌10美元,输出令牌50美元,约为Opus 4.8价格的两倍,这可能限制其广泛使用。

许多企业对AI成本日益敏感,部分原因是预算超支或提前用尽。高级模型如Opus 4.8的复杂推理能力可能导致单次请求拆分成多个任务,进一步推高成本。

Anthropic预计Fable 5需求将非常旺盛且难以预测。一些企业如购物奖励平台乐天认为其价值值得这一价格。

乐天表示:“在最高效能下,Fable能够反思并验证自身工作,这使得高度自主的运营成为可能,额外的思考带来了回报。”