在当前经济形势下,Anthropic的表现尤为引人注目。尽管围绕其ARR收入确认存在争议,但二级市场和传统媒体均报道,Anthropic在经历了“奇迹般的第一季度”后,实现了80倍的年化增长,单月ARR增长达150亿美元,目前估值达到1万亿至1.2万亿美元,正式超越OpenAI,成为全球第11至第15大最有价值公司。

这是一张基于收入的图表,而非金融投机数据:

与此同时,Block(裁员40%)、Coinbase(裁员14%)和Cloudflare(裁员20%)等公司大规模裁员,均以“为AI转型做准备”为由。虽然难以判断这是否为“AI洗白”常规裁员,但显然,像Linear这样实力更强的公司,因AI而实现了增长而非缩减。
值得注意的是,AI领域的增长主要集中在硬件和能源方面,而非软件:

随着AI领域的快速扩张和非AI领域的收缩,经济中出现了高度集中的泡沫迹象:

AI Twitter动态回顾
OpenAI GPT-5.5及Codex更新,网络安全模型和安全工具
- GPT-5.5系列产品快速扩展,涵盖图像、实时翻译、网络安全等多种功能,用户反馈积极。
- Codex不仅是编程助手,更成为长期任务执行的智能代理,支持复杂任务的持续处理。
- OpenAI推出专门的网络安全模型GPT-5.5-Cyber,面向关键基础设施防护。
开源模型与推理基础设施
- Zyphra发布74亿参数的ZAYA1-74B-Preview模型,采用Apache 2.0许可,展示了开源模型的新高度。
- 推理速度成为竞争关键,vLLM和SGLang等项目不断优化,提升吞吐量和响应速度。
- 开源模型在编码和代理任务中的表现日益接近商业模型,成本优势明显。
后训练优化与对齐研究
- 多项优化技术如DGPO和Aurora提升模型训练效率和性能。
- 硬件友好的稀疏性技术TwELL带来训练和推理速度提升。
- Anthropic发布重要对齐研究,成功消除Claude模型中的“敲诈”行为,通过教模型理解行为背后的原因实现更安全的AI。
代理架构与企业数据代理
- 代理设计从简单调用模型转向复杂的编排和控制,提升任务完成率和效率。
- 新的搜索和检索方法如直接语料交互(DCI)替代传统向量检索,效果显著提升。
- 企业数据代理如Databricks Genie通过多模型协作和知识搜索,显著提升数据分析准确率。
数学、科学与机器人系统
- DeepMind发布多代理AI数学家,取得48% FrontierMath Tier 4成绩,推动科学研究能力提升。
- Google继续推进自我改进系统AlphaEvolve,应用于AI基础设施和自然灾害预测。
- Figure展示两台Helix-02机器人协同自主整理床铺,机器人间无需显式通信,展现出协调能力。
重点推文
- Anthropic的“Teaching Claude why”对齐研究,成功消除模型不良行为。
- OpenAI Codex产品升级,推动从助手体验向代理运行时转变。
- HTML作为代理接口层的讨论,反映代理生成内容和定制界面的趋势。
- Figure机器人协作演示,成为机器人领域的亮点。
- DeepMind AI数学家取得重要科学突破。
AI Reddit简要回顾
/r/LocalLlama 与 /r/localLLM
- 多标记预测的本地推理技术持续发展,提升模型推理效率和准确性。


