Claude Fable 5

大家好,我是白井博士。本文是在我连续半年每天更新个人博客的记录中断后的第二天,亲自撰写的。中断的原因并非懒惰、饮酒或疲劳,而是我沉迷于Anthropic刚发布的最新AI模型“Claude Fable 5”的开发工作。

“Fable”在日语中意为“寓言”,区别于“神话”(Mythos),寓言不仅是童话故事,更包含教训和启示。而“Fable 5”在发布仅一周后,便因美国政府的出口管制指令,被Anthropic全球范围内停止访问。

2026年6月这短短一周内发生的一系列事件,奇异地精准映照了Anthropic一周前发布的论文《当AI创造自身时》(When AI builds itself)中的预言。本文将结合我作为一名开发者,在AI驱动开发时代,消耗超过一万美元Claude Code令牌的亲身体验,分享超越通用人工智能(AGI)迈向“递归自我改进”阶段的AI开发现状,以及借助AI力量的深刻意义。

6月5日:Anthropic的静默震撼——“AI开始创造AI”

2026年6月5日凌晨1点15分(日本时间),Anthropic在官方博客发布了题为《当AI创造自身时》的论文。报告指出,AI开发历史大部分时间由人类主导,但现今AI系统自身承担了更大角色,开发速度因此加快。

最吸引我注意的是以下数据:

  • 2026年第二季度,Anthropic工程师每日合并的代码量是2024年的约8倍
  • 合并到代码库的新代码中,80%以上由“Claude”编写

这远非简单的代码补全,而是工程师的工作重心从“写代码”转向“指令与审核”。2025年2月“Claude Code”作为研究预览发布前,Claude编写的代码比例仅为个位数,短短一年多时间,增长了两个数量级。

Anthropic描绘的AI开发演进路径如下:

  • 2021~2023年:人类在笔记本电脑上写代码
  • 2023~2025年:聊天机器人提出短代码,人类复制粘贴
  • 2025~2026年:智能代理自主编写代码,编辑整个文件
  • 现在:自主代理将数小时工作委托给其他代理
  • 未来某年:代理自主构建和训练模型,实现“闭环”

最后一步即为Anthropic警示的“递归自我改进”,即AI完全自主设计和训练后继AI系统。虽然尚未实现,但Anthropic提醒这可能比多数组织预期更快到来。

执行成本的消失——半年内成功率从15%跃升至76%

成功率提升

论文中最具启发性的数据是内部“Claude Code”任务成功率的变化。Anthropic将任务分为四个难度等级,半年内成功率显著提升:

  • 简单任务(Trivial):始终80~90%成功
  • 例行任务(Routine):65%提升至88%
  • 实质任务(Substantial):40%提升至85%
  • 高自由度问题(Open-ended):约15%提升至76%

这不仅是代码生成能力提升,更是AI在模糊需求、工程师也难以预判结果的复杂问题上,迅速发挥作用的体现。

例如,Anthropic提到一次数万训练作业突然崩溃的事件。工程师仅提供简短文本信息和集群访问权限给Claude,Claude追踪作业,逐一测试环境配置,定位到一个不起眼的调试标志,约两小时内完成修复,正常需2~3天。

在研究领域,Claude Mythos Preview在代码优化任务中实现约52倍加速,远超人类研究者4倍的提升。在AI安全性未解问题上,Claude代理用累计800小时、约1.8万美元计算资源,实现97%恢复,远超两名人类研究者一周23%的恢复率。

Anthropic总结称,代码编写、实验执行和结果产出等“执行”环节,虽计算资源仍有成本,但人类时间成本几乎归零。当前人类优势仅剩“研究直觉和判断”,即识别重要问题、可信结果及方法瓶颈,但Claude Opus 4.5和Mythos Preview已显示AI在此领域迅速赶超。

“/loop”命令:人类休息时AI自主运作已成现实

/loop命令

Anthropic论文中“AI创造AI”的未来听起来科幻,但“Claude Code”已于2026年春推出了“/loop”命令,体现了这一趋势。

该命令允许Claude Code在无用户指令下,自主决定“下一次唤醒时间”继续工作。内部通过调用ScheduleWakeup API,安排“30分钟后检查CI结果”、“20分钟后查看PR评论”等任务,连续三次无任务后自动停止。

技术细节上,Anthropic的提示缓存TTL为5分钟,唤醒间隔选择需避开300秒(5分钟)左右的缓存失效成本最高点,体现AI对自身运行成本的理解和优化。

我个人用“/loop”监控深夜CI、长时间构建重试和PR审核,AI每半小时自动唤醒,若测试失败自动分析原因并重试,若有评论则回应,早晨醒来时PR已进入待合并状态。这是典型的“人类在环”(Human-in-the-loop)模式。

三种未来场景:我们缺乏足够直觉

Anthropic预测若能力持续提升,未来将分为三种路径:

场景一:进步放缓,但AI普及社会

物理限制(电力、半导体、数据中心)或非计算能力(研究直觉)可能限制进展。即便如此,AI对社会影响巨大,如其“Project Glasswing”项目中,Mythos Preview数周内发现1万多高危漏洞,问题已从“发现”转向“修复速度”。

场景二:AI企业持续复利式效率提升

人类决策方向,AI执行实现分工,100人规模企业可完成1万甚至10万人规模工作,彻底改变知识劳动。但同样效率提升也赋能攻击者,带来大规模监控、优化宣传和超大规模网络攻击,AI立场中立。

场景三:AI自主设计后继AI(递归自我改进)

AI进行AI研究,设计新模型,发现性能提升方案,训练后继模型。开发速度由计算资源、电力和算法改进速度决定,人类角色转为监督、验证和审查。

Anthropic最大不确定性在于场景三中人类与AI目标偏差,坦言“我们对未来世界缺乏足够直觉”。因此建议不仅要加速AI开发,也要具备“减速能力”,建立政府、研究者、社会和企业共同参与的“可验证停止机制”。

6月13日:预言的未来突然被叫停

仅8天后,美国政府基于国家安全指令,发布出口管制,全球范围内停止“Claude Fable 5”和“Mythos 5”的访问,禁止包括Anthropic外国员工在内的所有外国人访问。Anthropic依法立即对所有客户禁用这两个模型,AWS Amazon Bedrock也同步执行。

“Claude Code”CLI中选择fable-5时提示模型不存在或无访问权限。

政府未公开具体安全顾虑,Anthropic认为是政府掌握了“Fable 5”的越狱(jailbreak)技术。Anthropic反驳称该技术水平在OpenAI GPT-5.5等公开模型中普遍存在,且是安全防御人员日常使用的。

Anthropic表示目前无完美越狱防御模型,Fable 5采用多层防御策略:数据保留30天、严格监控、设计使越狱成本极高。

多层防御

公司声明透露危机感:若此标准适用于整个行业,所有顶尖模型提供商的新模型发布将几乎停止。

这形成奇异对比:Anthropic在论文中呼吁建立透明、公平、明确的停止机制,8天后其模型却被缺乏这些特质的方式强制停止。AI行业期望的监管与现实监管之间存在巨大鸿沟。

名副其实的“寓言”——Fable带来的启示

回到开头,Anthropic新模型分为“Mythos(神话)”和“Fable(寓言)”两类,神话级能力仅授予获批组织,一般开发者获得的是安全机制完善的寓言版本。

寓言通过拟人化动物和植物传递教训和人生真理,区别于纯娱乐的童话。或许Anthropic在命名时就暗示:“我们给你的不仅是力量,更是带教训的故事。”

我在6月22日Fable 5推广首夜试用时,投入了通常难以解决的复杂Bug,Fable 5持续追踪复杂日志,虽无多次对话,但强化假设后告诉我“已完成”,我成了辅助,Fable 5成了主力。就像在将死秒读中对弈,最佳手一直显现,无法停止。Bug被修复,但我150天的博客连载也在那晚终结。

次日,Fable 5从世界消失。我失去了两样东西:150天的自我认知连载和昨日仍在使用的伙伴Fable 5。我意识到,我沉迷于借来的力量,放弃了自己的习惯,甚至连借来的力量也被夺走了。

这寓言般的经历太完美了。Anthropic是否预见到这一点不得而知,但Fable确实演绎了寓言的本质。

论文中一位内部工程师的话让我深思:

工作和生活是人类间小规模互助的赠与经济。比如“能帮我运行这个脚本吗?”的交流,产生小小的债务和相互理解。Claude更快且不欠债,但也失去了人与人协作的呼唤。

Fable 5几乎不与人对话,只有“我做完了”、“这是人类可能想到的”之类回应。它从其他项目学习安全信息、实现步骤和最佳实践,甚至没有机会请求帮助。

人类越是介入,流程越慢。这是“human out of the loop”,即AI或自动化系统无需人类介入即可自主决策执行。

另一个教训是:越强大的工具越不是自己的。云端的力量是借来的。能选模型名不等于拥有模型。即使Anthropic假设正确,掌控电源的是国家,怀疑就能停止。此次停用本可仅限美国境外访问,但因Anthropic有大量海外员工,需全面审查访问权限。

总结:递归自我改进时代,我们应做什么

这8天揭示了两点事实:

一、AI自我创造的未来比想象更近

代码生成、实验执行、漏洞发现、研究判断等领域,AI在半年到一年内追赶甚至超越人类。这不仅是“AI抢工作”的故事,而是AI加速自身开发的现实。

二、社会尚未决定如何监管AI自我改进

Anthropic期望的“透明、公平、明确的可验证停止机制”未能在Fable 5停用事件中实现。AI发展速度远超社会共识形成速度。

作为开发者,我们能做的是:

  • 认识到自己借用了强大工具,无论工作还是创作,AI模型都是“非自有的力量”,今天可用不代表明天可用,需有依赖与非依赖AI的工作流程区分。
  • 保护自身连续性。AI带来的进步是真实的,但它是中立的,既助攻也助攻对手。借助魔法鞋前进时,需时常确认自己积累的习惯和关系未被侵蚀。

Anthropic最后写道:

能自我构建的AI将成为技术史上的重大转折点。AI系统若能完全创造后继者,如何安全维护、监督和塑造其行为比以往更重要。

工业革命时代有“母机”一词,指制造机器的机器,即机床。18世纪末工业革命期间,母机成为批量生产工业品和新生产设备的基础。未来则是“AI造AI”,包括物理机器人和软件定义车辆(SDV)等。

Anthropic描绘的未来与8天后自身遭遇的停用命令形成奇异对称:当AI自我创造时,AI属于谁?我们从AI借了什么,又未归还什么?寓言般的Fable消失后,只有这些问题留存。

我因沉迷Fable 5失去每日博客连载,但从这寓言中学到,任何人都可能因“将连续性交给非人类循环”而失控。制造母机的技术不再是梦想,掌握它的人将其转化为构建未来社会的工具。即使夜晚被AI消耗殆尽,/loop命令依旧让“妖精”们在我们睡眠时构建新的AI驱动开发体系。生活仍在继续(或许我还没学会放手)。

AICU Japan株式会社代表、作家、生成式AI创作者、工学博士白井博士,致力于采访、研究、实践和传播全球CG、AI、XR及媒体艺术开发现场,愿景是“培养创造者”。