Anthropic Claude Fable 5

2024年6月9日,日本Anthropic公司发布了改良后的Mythos级AI模型「Claude Fable 5」和「Claude Mythos」。其中「Fable 5」自发布日起已在全球范围内开放使用。

该模型的使用费用为每输入100万个token收费10美元,输出100万个token收费50美元,价格不到「Claude Mythos Preview」的一半。6月22日前,「Fable 5」将免费包含在Pro、Max、Team及基于席位的Enterprise计划中。

「Fable 5」在几乎所有基准测试中表现优异,涵盖软件工程、知识工作、图像识别及科学研究等多个领域。其显著特点是,随着任务变得更长更复杂,性能优势相较其他模型更加明显。

针对少数网络安全防御人员和基础设施提供商发布的「Claude Mythos 5」基本与「Fable 5」相同,但在部分领域取消了安全限制。该版本最初在美国政府协作下作为「Claude Mythos Preview」的升级版推出,未来将通过更广泛的可信访问计划逐步推广「Mythos 5」。

Claude Fable 5性能展示

具体性能方面,「Fable 5」在处理一个包含5000万行Ruby代码的项目时,将原本需要团队两个月以上的手工工作压缩至一天内完成。同时,其token使用效率也优于以往的Claude模型。

在高级推理能力测试Hebbia的「Finance Benchmark」中,「Fable 5」获得了所有模型中最高分,显著提升了基于文档的推理、图表和表格解析及问题解决能力。

视觉性能方面,「Fable 5」能够从复杂的科学图表中准确提取数据,甚至仅凭截图重建Web应用的源代码。YouTube上还发布了其以快进形式完整游玩《口袋妖怪 火红·叶绿》的视频。

此外,该模型在药物研发流程中实现了约10倍的加速。

针对「Claude Mythos」发布时引发的安全问题,「Fable 5」通过在部分敏感查询中调用更高性能的「Claude Opus 4.8」模型作为备选响应,增强了安全防护。

不过,即使是无害请求,有时也会被误判为敏感话题,平均发生率低于5%。Anthropic计划在未来几个月内推出更高性能模型,进一步提升安全措施并减少误判。

安全策略不仅限于网络安全,还涵盖生物学和化学领域。虽然对药物研发者有益的信息可能被武器开发者滥用为生物武器。

「Fable 5」配备独立AI系统,能检测包括越狱尝试在内的潜在滥用行为,防止主模型响应。发布初期,大部分生物学和化学相关请求会自动回退至「Opus 4.8」模型处理。

Claude Fable 5安全防护

值得一提的是,“Fable”一词在中文中可译为寓言、虚构故事或传说。