OpenAI近日完成了有史以来最大规模的融资,估值增长数十亿美元,年经常性收入达到240亿美元,增长速度远超谷歌和Meta巅峰时期。同时,OpenAI也进行了“软IPO”,吸引了30亿美元的富豪投资,并被ARK Invest纳入ETF组合。尽管如此,ChatGPT的周活跃用户数增长似乎停滞,尚未达到2025年底预期的10亿用户目标,Codex也未公布新的里程碑。

然而,今日最大新闻莫过于Anthropic旗下Claude代码的源代码泄露事件。虽然对Anthropic的直接损害有限,但无疑令人尴尬,同时为编程代理领域的技术爱好者带来了宝贵的学习机会。泄露的代码库约有50万行代码,众多推文和帖子对此进行了深入解读,多个托管的代码分支也已上线供公众浏览。

泄露内容中包含许多有趣细节,如完整的动词列表、Capybara/Mythos v8版本、愚人节功能“/buddy”、Boris的“WTF计数器”、诞生的“Claude Codex”以及十余项未发布功能。技术专家们重点关注以下六大亮点:

  1. 在上下文中整合代码库状态(如最近提交、git分支信息)
  2. 激进的缓存复用策略
  3. 定制的Grep/Glob/LSP工具(行业标准),默认启用少于20种工具,总计超过60种,包括AgentTool、BashTool、文件读写编辑工具、网络抓取搜索工具、任务管理工具等

Claude工具列表

  1. 文件读取去重及工具结果采样
  2. 结构化会话记忆系统
  3. 子代理机制

架构示意图

记忆系统

Claude代码的记忆采用三层设计:1)MEMORY.md作为知识索引,2)按需加载的主题文件,3)可搜索的完整会话记录。还有“autoDream”模式,用于“睡眠”状态下的记忆合并、去重、修剪和矛盾消除。

记忆设计

深入分析揭示了记忆的八个阶段和五种压缩方式。

记忆阶段

压缩方式

子代理与提示缓存

Claude Code的一个关键特性是使用键值缓存实现子代理的分叉-合并模型,保证子代理拥有完整上下文,避免重复计算,实现了几乎免费的并行处理。

五级权限系统

权限系统

两种计划模式

计划模式

弹性与重试机制

重试机制

其他未发布及内部功能

包括员工专用门禁、员工终端界面,以及正在开发的ULTRAPLAN和KAIROS等项目。

内部功能

MAGIC DOCS

AI Twitter回顾

主要事件:Claude代码源泄露——架构揭秘、Anthropic回应及竞争者反应

泄露源于发布的源码映射和包内容,迅速引发公开的逆向工程、镜像和衍生项目。讨论焦点从“尴尬泄露”转向“揭示了先进代理设计的哪些秘密”。泄露内容主要是编排逻辑,而非模型权重,涵盖自主模式、记忆系统、计划与复盘流程及模型控制逻辑。公开分支数量激增,某分支曾获3.26万颗星和4.43万次分叉,后因法律风险转向使用Codex进行Python版本转换。泄露代码量超过50万行。Anthropic随后通过DMCA请求限制代码传播。同时,团队成员在事件期间宣布了新功能,表明产品运营正常。泄露还引发安全风险,攻击者注册了恶意npm包,针对试图编译泄露代码的用户。

事实与观点

以上内容基于公开推文和帖子整理,力求客观呈现事件全貌。