Claude代码源泄露事件解析

OpenAI近日完成了有史以来最大规模的融资，估值增长数十亿美元，年经常性收入达到240亿美元，增长速度远超谷歌和Meta巅峰时期。同时，OpenAI也进行了“软IPO”，吸引了30亿美元的富豪投资，并被ARK Invest纳入ETF组合。尽管如此，ChatGPT的周活跃用户数增长似乎停滞，尚未达到2025年底预期的10亿用户目标，Codex也未公布新的里程碑。

然而，今日最大新闻莫过于Anthropic旗下Claude代码的源代码泄露事件。虽然对Anthropic的直接损害有限，但无疑令人尴尬，同时为编程代理领域的技术爱好者带来了宝贵的学习机会。泄露的代码库约有50万行代码，众多推文和帖子对此进行了深入解读，多个托管的代码分支也已上线供公众浏览。

泄露内容中包含许多有趣细节，如完整的动词列表、Capybara/Mythos v8版本、愚人节功能“/buddy”、Boris的“WTF计数器”、诞生的“Claude Codex”以及十余项未发布功能。技术专家们重点关注以下六大亮点：

在上下文中整合代码库状态（如最近提交、git分支信息）
激进的缓存复用策略
定制的Grep/Glob/LSP工具（行业标准），默认启用少于20种工具，总计超过60种，包括AgentTool、BashTool、文件读写编辑工具、网络抓取搜索工具、任务管理工具等

Claude工具列表

文件读取去重及工具结果采样
结构化会话记忆系统
子代理机制

架构示意图

记忆系统

Claude代码的记忆采用三层设计：1）MEMORY.md作为知识索引，2）按需加载的主题文件，3）可搜索的完整会话记录。还有“autoDream”模式，用于“睡眠”状态下的记忆合并、去重、修剪和矛盾消除。

记忆设计

深入分析揭示了记忆的八个阶段和五种压缩方式。

记忆阶段

压缩方式

子代理与提示缓存

Claude Code的一个关键特性是使用键值缓存实现子代理的分叉-合并模型，保证子代理拥有完整上下文，避免重复计算，实现了几乎免费的并行处理。

五级权限系统

权限系统

两种计划模式

计划模式

弹性与重试机制

重试机制

其他未发布及内部功能

包括员工专用门禁、员工终端界面，以及正在开发的ULTRAPLAN和KAIROS等项目。

内部功能

MAGIC DOCS

AI Twitter回顾

主要事件：Claude代码源泄露——架构揭秘、Anthropic回应及竞争者反应

泄露源于发布的源码映射和包内容，迅速引发公开的逆向工程、镜像和衍生项目。讨论焦点从“尴尬泄露”转向“揭示了先进代理设计的哪些秘密”。泄露内容主要是编排逻辑，而非模型权重，涵盖自主模式、记忆系统、计划与复盘流程及模型控制逻辑。公开分支数量激增，某分支曾获3.26万颗星和4.43万次分叉，后因法律风险转向使用Codex进行Python版本转换。泄露代码量超过50万行。Anthropic随后通过DMCA请求限制代码传播。同时，团队成员在事件期间宣布了新功能，表明产品运营正常。泄露还引发安全风险，攻击者注册了恶意npm包，针对试图编译泄露代码的用户。

事实与观点

以上内容基于公开推文和帖子整理，力求客观呈现事件全貌。

Claude代码源泄露事件解析

记忆系统

子代理与提示缓存

五级权限系统

两种计划模式

弹性与重试机制

其他未发布及内部功能

AI Twitter回顾

事实与观点

标签

评论

相关阅读

一家AI代理初创公司让其代理自主完成1亿美元融资

15亿美元AI初创公司CEO被美国司法部指控大规模欺诈

大学生因依赖AI失去课堂讨论能力