揭秘OpenAI追赶Claude Code的竞赛内幕

在一间宽敞的会议室里，OpenAI的CEO萨姆·奥特曼（Sam Altman）与我探讨了人工智能编程革命，以及为何OpenAI似乎未能在这一领域领先。数百万软件工程师开始将编程任务交给AI，硅谷许多人首次面临工作自动化的挑战。编程代理成为企业愿意为AI支付高价的少数领域之一，这本应是OpenAI的又一辉煌时刻，但目前的主角却是另一家公司。

Anthropic，这家由OpenAI前员工创立的较小竞争对手，凭借其编程代理Claude Code取得了巨大成功。该产品占公司业务近五分之一，年收入超过25亿美元。而据知情人士透露，截至1月底，OpenAI的Codex年收入仅略超10亿美元。这究竟是为何？

奥特曼坦言：“先入市场价值巨大，我们在ChatGPT上就做到了这一点。”他认为现在是OpenAI加大编程领域投入的最佳时机，公司的AI模型已经足够强大，能够支持高效的编程代理。毕竟，公司为此投入了数十亿美元。“这将是一个巨大的市场——不仅经济价值巨大，编程还能解锁通用工作能力，”奥特曼说，“我不轻易说这种话，但我认为这是罕见的数万亿美元市场。”他还表示，Codex“很可能是实现通用人工智能（AGI）的最佳路径”，即超越人类完成大多数经济价值工作的AI系统。

然而，过去几年OpenAI内部的实际情况却复杂得多。通过与30多位现任领导和员工的访谈，包括匿名人士，描绘出OpenAI罕见的追赶局面。

早在Codex推出时，OpenAI联合创始人兼总裁格雷格·布罗克曼（Greg Brockman）就表示，Codex能够代表用户在计算机世界中执行命令。微软作为OpenAI最大投资者，利用Codex打造了首个商业AI产品GitHub Copilot，这款代码补全工具在程序员的日常环境中运行。尽管早期Codex功能有限，但微软高管视其为AI未来的标志。2022年6月GitHub Copilot公开发布后，数月内吸引了数十万用户。

随后，OpenAI的Codex团队转向其他项目，认为未来模型将内置编程能力，无需独立团队。一些工程师被调往图像生成器DALL-E 2，另一些则参与训练GPT-4，视为接近AGI的关键。2022年11月ChatGPT发布后迅速获得1亿用户，其他项目暂停，OpenAI多年未设专门团队开发AI编程产品。前Codex团队成员表示，编程领域似乎被GitHub Copilot覆盖，OpenAI只负责提供模型支持，微软主导市场。

2023至2024年，OpenAI重点投资多模态AI模型和代理，旨在理解文本、图像、视频和音频，并模拟人类操作光标和键盘。这与行业趋势相符，Midjourney等初创公司因AI图像模型走红，普遍认为大型语言模型需具备多感官能力才能实现真正智能。

Anthropic则走了不同路线，虽涉足聊天机器人和多模态模型，但更早看到了编程的潜力。布罗克曼在播客中称赞Anthropic从一开始就专注于编程，训练模型不仅使用学术竞赛中的难题，还涵盖真实且复杂的代码库，“这是我们迟缓的教训”。

2024年初，Anthropic训练Claude Sonnet 3.5模型时使用了这些复杂代码库。6月发布后，用户对其编程能力印象深刻。初创公司Cursor利用Anthropic模型让开发者用自然语言指令编程，用户量迅速增长。随后Anthropic开始内部测试Claude Code。

Cursor受欢迎后，OpenAI曾尝试收购该公司，但创始人拒绝，选择保持独立，认为编程市场潜力巨大。

当时，OpenAI正在训练首个推理模型o1，能逐步解决问题并生成复杂代码。Codex研究负责人安德烈·米申科（Andrey Mishchenko）指出，编程作为可验证任务，模型能通过代码是否运行获得明确反馈，从而不断提升能力。没有推理能力，编程代理无法达到现有水平。

到2024年12月，OpenAI内部多个小组开始聚焦AI编程代理。米申科与前谷歌DeepMind研究员、现Codex负责人蒂博·索蒂奥（Thibault Sottiaux）领导团队，最初目标是加速AI研究，自动化训练管理和GPU监控。另一团队由亚历山大·恩比里科斯（Alexander Embiricos）领导，开发了名为Jam的演示工具，能直接访问命令行并执行代码，远超2021年Codex只能输出代码的能力。

经过数月整合，2025年初OpenAI训练出更强的o3模型，终于具备打造真正AI编程产品的基础。但此时Claude Code已准备公开发布。

OpenAI紧急组建“冲刺团队”，计划数周内推出竞争产品。奥特曼还尝试以30亿美元收购AI编程初创公司Windsurf，期望借此快速领先，获得成熟产品、经验团队和企业客户。

但收购因微软介入而搁置。微软作为OpenAI重要合作伙伴，长期使用OpenAI模型支持GitHub Copilot，担心新产品影响现有业务。双方合作关系紧张，收购最终于2025年7月破裂。Windsurf创始人被谷歌挖走，团队被另一初创公司收购。

奥特曼表示遗憾，但对Codex团队的进展感到满意。2025年8月，OpenAI加速推进。布罗克曼称，去年大部分时间，最强模型仍需数小时和人工指导才能完成复杂任务，但到12月，基于GPT-5.2的Codex能凭单条指令完成完整游戏开发。

全球开发者纷纷注意到AI编程代理的显著提升，围绕Claude Code的讨论走出硅谷，成为主流新闻。无编程经验的普通用户也开始利用这些工具开发定制软件。

Anthropic和OpenAI在此期间大力投入市场推广，许多开发者表示，月费200美元的Codex和Claude Code套餐能带来超过1000美元的使用价值，这种优惠策略旨在推动企业内部使用，后续按使用量收费。

2025年9月，Codex使用量仅为Claude Code的5%，但到2026年1月已提升至约40%。

开发者乔治·皮克特（George Pickett）组织Codex用户聚会，认为AI代理将取代白领工作，社会影响难以预料，但他对未来持乐观态度。

价值110亿美元的生产力初创公司Notion联合创始人西蒙·拉斯特（Simon Last）表示，因稳定性原因，他和顶尖工程师在GPT-5.2发布时转向Codex，“Claude Code经常误导我，表现不如实”。

Codex团队研究负责人凯蒂·施（Katy Shi）说，虽然有人觉得Codex风格“干巴巴”，但许多人欣赏其不阿谀奉承的态度，“工程工作需要接受批评而不觉得刻薄”。

多家大型企业也签约使用Codex。OpenAI应用业务CEO菲吉·西莫（Fidji Simo）称，ChatGPT作为AI代名词，助力Codex在B2B市场占据优势，企业倾向采用员工熟悉的技术。Codex销售策略主要是与ChatGPT等产品捆绑。

思科总裁兼首席产品官吉图·帕特尔（Jeetu Patel）告诉员工不用担心使用Codex的成本，强调不使用这些工具才会失业，因为那样会失去竞争力。

在OpenAI总部，我参加了一场Codex黑客马拉松，约100名工程师在四小时内竞赛开发最佳演示。许多项目既用Codex开发，也帮助提升Codex使用效率，如自动汇总Slack消息、生成内部服务指南等，过去需数天完成的工作现在只需一下午。

临别时，我遇到负责科学部门的前Instagram高管凯文·韦尔（Kevin Weil），他告诉我晚上让Codex处理项目，早晨再检查，这已成常态。OpenAI 2026年的目标之一是开发自动化实习生，专门研究AI。

西莫表示，未来希望Codex能为ChatGPT及所有产品提供支持，不仅限于编程，而是帮助用户完成各种任务。奥特曼希望发布通用版本，但担忧安全风险。1月底，他拒绝帮一位非技术朋友设置病毒式传播的AI编程代理OpenClaw，因其可能删除重要文件。几周后，OpenAI宣布聘请OpenClaw创始人。

多位开发者称，Codex与Claude Code的竞争异常激烈。随着这些工具能力提升并被企业广泛采用，社会面临的挑战远超选择哪款编程代理。

部分监督机构担忧OpenAI追赶Claude Code过程中忽视安全。非营利组织Midas Project指责OpenAI未充分披露GPT-5.3-Codex的网络安全风险。OpenAI对安全负责人阿米莉亚·格莱斯（Amelia Glaese）否认此说法，称Midas误解了公司的承诺。

布罗克曼去年曾向支持AI的超级政治行动委员会和支持特朗普的组织各捐赠2500万美元，称“我们正按计划推进AGI”。他以往以对代码痴迷著称，但如今更多依赖AI代理完成目标，感到既解放又失去对细节的掌控。“作为数十万代理的CEO，你不再深入每个问题的解决细节，有时会觉得失去对问题的脉搏。”

揭秘OpenAI追赶Claude Code的竞赛内幕

标签

评论

相关阅读

中国AI研究人员在X平台上逐渐发声

Smallest.ai完成1300万美元融资，打造极致逼真的超快语音AI

TechCrunch出行：汽车行业的AI技能竞赛即将来临