在一间宽敞的会议室里,OpenAI的CEO萨姆·奥特曼(Sam Altman)与我探讨了人工智能编程革命,以及为何OpenAI似乎未能在这一领域领先。数百万软件工程师开始将编程任务交给AI,硅谷许多人首次面临工作自动化的挑战。编程代理成为企业愿意为AI支付高价的少数领域之一,这本应是OpenAI的又一辉煌时刻,但目前的主角却是另一家公司。
Anthropic,这家由OpenAI前员工创立的较小竞争对手,凭借其编程代理Claude Code取得了巨大成功。该产品占公司业务近五分之一,年收入超过25亿美元。而据知情人士透露,截至1月底,OpenAI的Codex年收入仅略超10亿美元。这究竟是为何?
奥特曼坦言:“先入市场价值巨大,我们在ChatGPT上就做到了这一点。”他认为现在是OpenAI加大编程领域投入的最佳时机,公司的AI模型已经足够强大,能够支持高效的编程代理。毕竟,公司为此投入了数十亿美元。“这将是一个巨大的市场——不仅经济价值巨大,编程还能解锁通用工作能力,”奥特曼说,“我不轻易说这种话,但我认为这是罕见的数万亿美元市场。”他还表示,Codex“很可能是实现通用人工智能(AGI)的最佳路径”,即超越人类完成大多数经济价值工作的AI系统。
然而,过去几年OpenAI内部的实际情况却复杂得多。通过与30多位现任领导和员工的访谈,包括匿名人士,描绘出OpenAI罕见的追赶局面。
早在Codex推出时,OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)就表示,Codex能够代表用户在计算机世界中执行命令。微软作为OpenAI最大投资者,利用Codex打造了首个商业AI产品GitHub Copilot,这款代码补全工具在程序员的日常环境中运行。尽管早期Codex功能有限,但微软高管视其为AI未来的标志。2022年6月GitHub Copilot公开发布后,数月内吸引了数十万用户。
随后,OpenAI的Codex团队转向其他项目,认为未来模型将内置编程能力,无需独立团队。一些工程师被调往图像生成器DALL-E 2,另一些则参与训练GPT-4,视为接近AGI的关键。2022年11月ChatGPT发布后迅速获得1亿用户,其他项目暂停,OpenAI多年未设专门团队开发AI编程产品。前Codex团队成员表示,编程领域似乎被GitHub Copilot覆盖,OpenAI只负责提供模型支持,微软主导市场。
2023至2024年,OpenAI重点投资多模态AI模型和代理,旨在理解文本、图像、视频和音频,并模拟人类操作光标和键盘。这与行业趋势相符,Midjourney等初创公司因AI图像模型走红,普遍认为大型语言模型需具备多感官能力才能实现真正智能。
Anthropic则走了不同路线,虽涉足聊天机器人和多模态模型,但更早看到了编程的潜力。布罗克曼在播客中称赞Anthropic从一开始就专注于编程,训练模型不仅使用学术竞赛中的难题,还涵盖真实且复杂的代码库,“这是我们迟缓的教训”。
2024年初,Anthropic训练Claude Sonnet 3.5模型时使用了这些复杂代码库。6月发布后,用户对其编程能力印象深刻。初创公司Cursor利用Anthropic模型让开发者用自然语言指令编程,用户量迅速增长。随后Anthropic开始内部测试Claude Code。
Cursor受欢迎后,OpenAI曾尝试收购该公司,但创始人拒绝,选择保持独立,认为编程市场潜力巨大。
当时,OpenAI正在训练首个推理模型o1,能逐步解决问题并生成复杂代码。Codex研究负责人安德烈·米申科(Andrey Mishchenko)指出,编程作为可验证任务,模型能通过代码是否运行获得明确反馈,从而不断提升能力。没有推理能力,编程代理无法达到现有水平。
到2024年12月,OpenAI内部多个小组开始聚焦AI编程代理。米申科与前谷歌DeepMind研究员、现Codex负责人蒂博·索蒂奥(Thibault Sottiaux)领导团队,最初目标是加速AI研究,自动化训练管理和GPU监控。另一团队由亚历山大·恩比里科斯(Alexander Embiricos)领导,开发了名为Jam的演示工具,能直接访问命令行并执行代码,远超2021年Codex只能输出代码的能力。
经过数月整合,2025年初OpenAI训练出更强的o3模型,终于具备打造真正AI编程产品的基础。但此时Claude Code已准备公开发布。
OpenAI紧急组建“冲刺团队”,计划数周内推出竞争产品。奥特曼还尝试以30亿美元收购AI编程初创公司Windsurf,期望借此快速领先,获得成熟产品、经验团队和企业客户。
但收购因微软介入而搁置。微软作为OpenAI重要合作伙伴,长期使用OpenAI模型支持GitHub Copilot,担心新产品影响现有业务。双方合作关系紧张,收购最终于2025年7月破裂。Windsurf创始人被谷歌挖走,团队被另一初创公司收购。

奥特曼表示遗憾,但对Codex团队的进展感到满意。2025年8月,OpenAI加速推进。布罗克曼称,去年大部分时间,最强模型仍需数小时和人工指导才能完成复杂任务,但到12月,基于GPT-5.2的Codex能凭单条指令完成完整游戏开发。
全球开发者纷纷注意到AI编程代理的显著提升,围绕Claude Code的讨论走出硅谷,成为主流新闻。无编程经验的普通用户也开始利用这些工具开发定制软件。
Anthropic和OpenAI在此期间大力投入市场推广,许多开发者表示,月费200美元的Codex和Claude Code套餐能带来超过1000美元的使用价值,这种优惠策略旨在推动企业内部使用,后续按使用量收费。
2025年9月,Codex使用量仅为Claude Code的5%,但到2026年1月已提升至约40%。
开发者乔治·皮克特(George Pickett)组织Codex用户聚会,认为AI代理将取代白领工作,社会影响难以预料,但他对未来持乐观态度。
价值110亿美元的生产力初创公司Notion联合创始人西蒙·拉斯特(Simon Last)表示,因稳定性原因,他和顶尖工程师在GPT-5.2发布时转向Codex,“Claude Code经常误导我,表现不如实”。
Codex团队研究负责人凯蒂·施(Katy Shi)说,虽然有人觉得Codex风格“干巴巴”,但许多人欣赏其不阿谀奉承的态度,“工程工作需要接受批评而不觉得刻薄”。
多家大型企业也签约使用Codex。OpenAI应用业务CEO菲吉·西莫(Fidji Simo)称,ChatGPT作为AI代名词,助力Codex在B2B市场占据优势,企业倾向采用员工熟悉的技术。Codex销售策略主要是与ChatGPT等产品捆绑。
思科总裁兼首席产品官吉图·帕特尔(Jeetu Patel)告诉员工不用担心使用Codex的成本,强调不使用这些工具才会失业,因为那样会失去竞争力。
在OpenAI总部,我参加了一场Codex黑客马拉松,约100名工程师在四小时内竞赛开发最佳演示。许多项目既用Codex开发,也帮助提升Codex使用效率,如自动汇总Slack消息、生成内部服务指南等,过去需数天完成的工作现在只需一下午。
临别时,我遇到负责科学部门的前Instagram高管凯文·韦尔(Kevin Weil),他告诉我晚上让Codex处理项目,早晨再检查,这已成常态。OpenAI 2026年的目标之一是开发自动化实习生,专门研究AI。
西莫表示,未来希望Codex能为ChatGPT及所有产品提供支持,不仅限于编程,而是帮助用户完成各种任务。奥特曼希望发布通用版本,但担忧安全风险。1月底,他拒绝帮一位非技术朋友设置病毒式传播的AI编程代理OpenClaw,因其可能删除重要文件。几周后,OpenAI宣布聘请OpenClaw创始人。
多位开发者称,Codex与Claude Code的竞争异常激烈。随着这些工具能力提升并被企业广泛采用,社会面临的挑战远超选择哪款编程代理。
部分监督机构担忧OpenAI追赶Claude Code过程中忽视安全。非营利组织Midas Project指责OpenAI未充分披露GPT-5.3-Codex的网络安全风险。OpenAI对安全负责人阿米莉亚·格莱斯(Amelia Glaese)否认此说法,称Midas误解了公司的承诺。
布罗克曼去年曾向支持AI的超级政治行动委员会和支持特朗普的组织各捐赠2500万美元,称“我们正按计划推进AGI”。他以往以对代码痴迷著称,但如今更多依赖AI代理完成目标,感到既解放又失去对细节的掌控。“作为数十万代理的CEO,你不再深入每个问题的解决细节,有时会觉得失去对问题的脉搏。”
