在当前经济形势下,Anthropic的表现尤为引人注目。尽管围绕其ARR收入确认存在争议,但二级市场和传统媒体均报道,Anthropic在经历了“奇迹般的第一季度”后,实现了80倍的年化增长,单月ARR增长达150亿美元,目前估值达到1万亿至1.2万亿美元,正式超越OpenAI,成为全球第11至第15大最有价值公司。

Anthropic增长图

这是一张基于收入的图表,而非金融投机数据:

收入图表

与此同时,Block(裁员40%)、Coinbase(裁员14%)和Cloudflare(裁员20%)等公司大规模裁员,均以“为AI转型做准备”为由。虽然难以判断这是否为“AI洗白”常规裁员,但显然,像Linear这样实力更强的公司,因AI而实现了增长而非缩减。

值得注意的是,AI领域的增长主要集中在硬件和能源方面,而非软件:

硬件与能源增长

随着AI领域的快速扩张和非AI领域的收缩,经济中出现了高度集中的泡沫迹象:

经济集中度


AI Twitter动态回顾

OpenAI GPT-5.5及Codex更新,网络安全模型和安全工具

  • GPT-5.5系列产品快速扩展,涵盖图像、实时翻译、网络安全等多种功能,用户反馈积极。
  • Codex不仅是编程助手,更成为长期任务执行的智能代理,支持复杂任务的持续处理。
  • OpenAI推出专门的网络安全模型GPT-5.5-Cyber,面向关键基础设施防护。

开源模型与推理基础设施

  • Zyphra发布74亿参数的ZAYA1-74B-Preview模型,采用Apache 2.0许可,展示了开源模型的新高度。
  • 推理速度成为竞争关键,vLLM和SGLang等项目不断优化,提升吞吐量和响应速度。
  • 开源模型在编码和代理任务中的表现日益接近商业模型,成本优势明显。

后训练优化与对齐研究

  • 多项优化技术如DGPO和Aurora提升模型训练效率和性能。
  • 硬件友好的稀疏性技术TwELL带来训练和推理速度提升。
  • Anthropic发布重要对齐研究,成功消除Claude模型中的“敲诈”行为,通过教模型理解行为背后的原因实现更安全的AI。

代理架构与企业数据代理

  • 代理设计从简单调用模型转向复杂的编排和控制,提升任务完成率和效率。
  • 新的搜索和检索方法如直接语料交互(DCI)替代传统向量检索,效果显著提升。
  • 企业数据代理如Databricks Genie通过多模型协作和知识搜索,显著提升数据分析准确率。

数学、科学与机器人系统

  • DeepMind发布多代理AI数学家,取得48% FrontierMath Tier 4成绩,推动科学研究能力提升。
  • Google继续推进自我改进系统AlphaEvolve,应用于AI基础设施和自然灾害预测。
  • Figure展示两台Helix-02机器人协同自主整理床铺,机器人间无需显式通信,展现出协调能力。

重点推文

  • Anthropic的“Teaching Claude why”对齐研究,成功消除模型不良行为。
  • OpenAI Codex产品升级,推动从助手体验向代理运行时转变。
  • HTML作为代理接口层的讨论,反映代理生成内容和定制界面的趋势。
  • Figure机器人协作演示,成为机器人领域的亮点。
  • DeepMind AI数学家取得重要科学突破。

AI Reddit简要回顾

/r/LocalLlama 与 /r/localLLM

  • 多标记预测的本地推理技术持续发展,提升模型推理效率和准确性。