Anthropic作为史上增长最快的公司之一,长期以来一直瞄准超越OpenAI。近日,Anthropic正式宣布其年收入达到470亿美元(去年12月仅为90亿美元),并完成了65亿美元的H轮融资,融资后估值达到9650亿美元。此次融资包括来自亚马逊等超大规模云服务商的150亿美元投资,使其在多个关键指标上暂时领先于OpenAI,除了计算资源和非编码基准外。

Anthropic融资及产品发布

为庆祝这一里程碑,Anthropic发布了Claude Opus 4.8版本,修复了社区对4.7版本的多项反馈问题。Opus 4.8在经济相关的各类基准测试中表现出色,甚至被认为优于谷歌的Gemini 3.1 Pro版本。

Opus 4.8性能表现

更具长远意义的是,Anthropic在Claude Code中引入了“动态工作流”(Dynamic Workflows)功能,也称为ultracode。该功能支持Claude自动规划任务,并启动数百个并行子代理,极大提升了复杂任务的处理效率。比如,Jarred Sumner利用此功能在6天内完成了Bun项目从Zig到Rust的75万行代码重写。

动态工作流示意

关键事实与声明

  • Anthropic完成65亿美元H轮融资,融资后估值9650亿美元。
  • 年收入达到470亿美元,主要来自企业部署和日常使用。
  • 主要投资方包括Altimeter、Dragoneer、Greenoaks和红杉资本。
  • Opus 4.8版本在价格不变的情况下,提升了判断力、诚实度和自主工作能力。
  • 动态工作流支持在Max、Team、Enterprise、API、Bedrock、Vertex AI和Foundry等平台上使用。

Opus 4.8产品特点

  • 采用了基于4.7版本反馈的多项修正,提升了细节理解和自然对话能力。
  • 更加诚实,能主动指出自身知识盲区和代码缺陷,避免过度自信。
  • 支持长时间独立工作,适合复杂的编码和知识工作。
  • 价格保持不变,且新增了“快速模式”,速度提升2.5倍,成本降低3倍。

性能与效率

  • 在SWE-Bench Pro、APEX-SWE等多个编码基准中领先GPT-5.5。
  • 1百万token的上下文窗口支持长文本处理,接近GPT-5.5的256K表现。
  • 相较4.7版本,4.8在完成任务时使用更少的交互轮次和输出token,但仍比GPT-5.5消耗更多。

安全性与稳健性

  • 诚实度和校准度显著提升,幻觉率低于谷歌和OpenAI同类模型。
  • 但在抗提示注入攻击方面未见明显改进。
  • 计划推出更高智能级别的Mythos级模型,配备更强的安全防护。

动态工作流的意义

  • Claude能即时生成任务编排脚本,启动数百个子代理并行执行。
  • 支持大规模代码迁移、重构和审计任务。
  • 目前存在编辑冲突、成本高昂等挑战,但被视为未来编码代理的发展方向。

社区反响

  • 支持者认为Opus 4.8是一次重大升级,Anthropic重回领先地位。
  • 质疑者认为其更多是在追赶OpenAI,且动态工作流的成本和效率仍需优化。

Anthropic此次融资和产品发布,展示了其在AI领域的雄心和实力,也预示着企业级AI应用的快速发展。