AI自我创造的预言与现实：Anthropic最新模型“Claude Fable 5”的消失

Claude Fable 5

大家好，我是白井博士。本文是在我连续半年每天更新个人博客的记录中断后的第二天，亲自撰写的。中断的原因并非懒惰、饮酒或疲劳，而是我沉迷于Anthropic刚发布的最新AI模型“Claude Fable 5”的开发工作。

“Fable”在日语中意为“寓言”，区别于“神话”（Mythos），寓言不仅是童话故事，更包含教训和启示。而“Fable 5”在发布仅一周后，便因美国政府的出口管制指令，被Anthropic全球范围内停止访问。

2026年6月这短短一周内发生的一系列事件，奇异地精准映照了Anthropic一周前发布的论文《当AI创造自身时》（When AI builds itself）中的预言。本文将结合我作为一名开发者，在AI驱动开发时代，消耗超过一万美元Claude Code令牌的亲身体验，分享超越通用人工智能（AGI）迈向“递归自我改进”阶段的AI开发现状，以及借助AI力量的深刻意义。

6月5日：Anthropic的静默震撼——“AI开始创造AI”

2026年6月5日凌晨1点15分（日本时间），Anthropic在官方博客发布了题为《当AI创造自身时》的论文。报告指出，AI开发历史大部分时间由人类主导，但现今AI系统自身承担了更大角色，开发速度因此加快。

最吸引我注意的是以下数据：

2026年第二季度，Anthropic工程师每日合并的代码量是2024年的约8倍
合并到代码库的新代码中，80%以上由“Claude”编写

这远非简单的代码补全，而是工程师的工作重心从“写代码”转向“指令与审核”。2025年2月“Claude Code”作为研究预览发布前，Claude编写的代码比例仅为个位数，短短一年多时间，增长了两个数量级。

Anthropic描绘的AI开发演进路径如下：

2021~2023年：人类在笔记本电脑上写代码
2023~2025年：聊天机器人提出短代码，人类复制粘贴
2025~2026年：智能代理自主编写代码，编辑整个文件
现在：自主代理将数小时工作委托给其他代理
未来某年：代理自主构建和训练模型，实现“闭环”

最后一步即为Anthropic警示的“递归自我改进”，即AI完全自主设计和训练后继AI系统。虽然尚未实现，但Anthropic提醒这可能比多数组织预期更快到来。

执行成本的消失——半年内成功率从15%跃升至76%

成功率提升

论文中最具启发性的数据是内部“Claude Code”任务成功率的变化。Anthropic将任务分为四个难度等级，半年内成功率显著提升：

简单任务（Trivial）：始终80~90%成功
例行任务（Routine）：65%提升至88%
实质任务（Substantial）：40%提升至85%
高自由度问题（Open-ended）：约15%提升至76%

这不仅是代码生成能力提升，更是AI在模糊需求、工程师也难以预判结果的复杂问题上，迅速发挥作用的体现。

例如，Anthropic提到一次数万训练作业突然崩溃的事件。工程师仅提供简短文本信息和集群访问权限给Claude，Claude追踪作业，逐一测试环境配置，定位到一个不起眼的调试标志，约两小时内完成修复，正常需2~3天。

在研究领域，Claude Mythos Preview在代码优化任务中实现约52倍加速，远超人类研究者4倍的提升。在AI安全性未解问题上，Claude代理用累计800小时、约1.8万美元计算资源，实现97%恢复，远超两名人类研究者一周23%的恢复率。

Anthropic总结称，代码编写、实验执行和结果产出等“执行”环节，虽计算资源仍有成本，但人类时间成本几乎归零。当前人类优势仅剩“研究直觉和判断”，即识别重要问题、可信结果及方法瓶颈，但Claude Opus 4.5和Mythos Preview已显示AI在此领域迅速赶超。

“/loop”命令：人类休息时AI自主运作已成现实

/loop命令

Anthropic论文中“AI创造AI”的未来听起来科幻，但“Claude Code”已于2026年春推出了“/loop”命令，体现了这一趋势。

该命令允许Claude Code在无用户指令下，自主决定“下一次唤醒时间”继续工作。内部通过调用ScheduleWakeup API，安排“30分钟后检查CI结果”、“20分钟后查看PR评论”等任务，连续三次无任务后自动停止。

技术细节上，Anthropic的提示缓存TTL为5分钟，唤醒间隔选择需避开300秒（5分钟）左右的缓存失效成本最高点，体现AI对自身运行成本的理解和优化。

我个人用“/loop”监控深夜CI、长时间构建重试和PR审核，AI每半小时自动唤醒，若测试失败自动分析原因并重试，若有评论则回应，早晨醒来时PR已进入待合并状态。这是典型的“人类在环”（Human-in-the-loop）模式。

三种未来场景：我们缺乏足够直觉

Anthropic预测若能力持续提升，未来将分为三种路径：

场景一：进步放缓，但AI普及社会

物理限制（电力、半导体、数据中心）或非计算能力（研究直觉）可能限制进展。即便如此，AI对社会影响巨大，如其“Project Glasswing”项目中，Mythos Preview数周内发现1万多高危漏洞，问题已从“发现”转向“修复速度”。

场景二：AI企业持续复利式效率提升

人类决策方向，AI执行实现分工，100人规模企业可完成1万甚至10万人规模工作，彻底改变知识劳动。但同样效率提升也赋能攻击者，带来大规模监控、优化宣传和超大规模网络攻击，AI立场中立。

场景三：AI自主设计后继AI（递归自我改进）

AI进行AI研究，设计新模型，发现性能提升方案，训练后继模型。开发速度由计算资源、电力和算法改进速度决定，人类角色转为监督、验证和审查。

Anthropic最大不确定性在于场景三中人类与AI目标偏差，坦言“我们对未来世界缺乏足够直觉”。因此建议不仅要加速AI开发，也要具备“减速能力”，建立政府、研究者、社会和企业共同参与的“可验证停止机制”。

6月13日：预言的未来突然被叫停

仅8天后，美国政府基于国家安全指令，发布出口管制，全球范围内停止“Claude Fable 5”和“Mythos 5”的访问，禁止包括Anthropic外国员工在内的所有外国人访问。Anthropic依法立即对所有客户禁用这两个模型，AWS Amazon Bedrock也同步执行。

“Claude Code”CLI中选择fable-5时提示模型不存在或无访问权限。

政府未公开具体安全顾虑，Anthropic认为是政府掌握了“Fable 5”的越狱（jailbreak）技术。Anthropic反驳称该技术水平在OpenAI GPT-5.5等公开模型中普遍存在，且是安全防御人员日常使用的。

Anthropic表示目前无完美越狱防御模型，Fable 5采用多层防御策略：数据保留30天、严格监控、设计使越狱成本极高。

多层防御

公司声明透露危机感：若此标准适用于整个行业，所有顶尖模型提供商的新模型发布将几乎停止。

这形成奇异对比：Anthropic在论文中呼吁建立透明、公平、明确的停止机制，8天后其模型却被缺乏这些特质的方式强制停止。AI行业期望的监管与现实监管之间存在巨大鸿沟。

名副其实的“寓言”——Fable带来的启示

回到开头，Anthropic新模型分为“Mythos（神话）”和“Fable（寓言）”两类，神话级能力仅授予获批组织，一般开发者获得的是安全机制完善的寓言版本。

寓言通过拟人化动物和植物传递教训和人生真理，区别于纯娱乐的童话。或许Anthropic在命名时就暗示：“我们给你的不仅是力量，更是带教训的故事。”

我在6月22日Fable 5推广首夜试用时，投入了通常难以解决的复杂Bug，Fable 5持续追踪复杂日志，虽无多次对话，但强化假设后告诉我“已完成”，我成了辅助，Fable 5成了主力。就像在将死秒读中对弈，最佳手一直显现，无法停止。Bug被修复，但我150天的博客连载也在那晚终结。

次日，Fable 5从世界消失。我失去了两样东西：150天的自我认知连载和昨日仍在使用的伙伴Fable 5。我意识到，我沉迷于借来的力量，放弃了自己的习惯，甚至连借来的力量也被夺走了。

这寓言般的经历太完美了。Anthropic是否预见到这一点不得而知，但Fable确实演绎了寓言的本质。

论文中一位内部工程师的话让我深思：

工作和生活是人类间小规模互助的赠与经济。比如“能帮我运行这个脚本吗？”的交流，产生小小的债务和相互理解。Claude更快且不欠债，但也失去了人与人协作的呼唤。

Fable 5几乎不与人对话，只有“我做完了”、“这是人类可能想到的”之类回应。它从其他项目学习安全信息、实现步骤和最佳实践，甚至没有机会请求帮助。

人类越是介入，流程越慢。这是“human out of the loop”，即AI或自动化系统无需人类介入即可自主决策执行。

另一个教训是：越强大的工具越不是自己的。云端的力量是借来的。能选模型名不等于拥有模型。即使Anthropic假设正确，掌控电源的是国家，怀疑就能停止。此次停用本可仅限美国境外访问，但因Anthropic有大量海外员工，需全面审查访问权限。

总结：递归自我改进时代，我们应做什么

这8天揭示了两点事实：

一、AI自我创造的未来比想象更近

代码生成、实验执行、漏洞发现、研究判断等领域，AI在半年到一年内追赶甚至超越人类。这不仅是“AI抢工作”的故事，而是AI加速自身开发的现实。

二、社会尚未决定如何监管AI自我改进

Anthropic期望的“透明、公平、明确的可验证停止机制”未能在Fable 5停用事件中实现。AI发展速度远超社会共识形成速度。

作为开发者，我们能做的是：

认识到自己借用了强大工具，无论工作还是创作，AI模型都是“非自有的力量”，今天可用不代表明天可用，需有依赖与非依赖AI的工作流程区分。
保护自身连续性。AI带来的进步是真实的，但它是中立的，既助攻也助攻对手。借助魔法鞋前进时，需时常确认自己积累的习惯和关系未被侵蚀。

Anthropic最后写道：

能自我构建的AI将成为技术史上的重大转折点。AI系统若能完全创造后继者，如何安全维护、监督和塑造其行为比以往更重要。

工业革命时代有“母机”一词，指制造机器的机器，即机床。18世纪末工业革命期间，母机成为批量生产工业品和新生产设备的基础。未来则是“AI造AI”，包括物理机器人和软件定义车辆（SDV）等。

Anthropic描绘的未来与8天后自身遭遇的停用命令形成奇异对称：当AI自我创造时，AI属于谁？我们从AI借了什么，又未归还什么？寓言般的Fable消失后，只有这些问题留存。

我因沉迷Fable 5失去每日博客连载，但从这寓言中学到，任何人都可能因“将连续性交给非人类循环”而失控。制造母机的技术不再是梦想，掌握它的人将其转化为构建未来社会的工具。即使夜晚被AI消耗殆尽，/loop命令依旧让“妖精”们在我们睡眠时构建新的AI驱动开发体系。生活仍在继续（或许我还没学会放手）。

AICU Japan株式会社代表、作家、生成式AI创作者、工学博士白井博士，致力于采访、研究、实践和传播全球CG、AI、XR及媒体艺术开发现场，愿景是“培养创造者”。