目前,OpenAI与Anthropic之间正展开一场低烈度的竞争,争夺谁能推出更便捷、更强大的AI编程工具。到目前为止,Anthropic似乎占据了优势。正如TechCrunch上周报道,Claude Code已成为许多企业的首选工具,但OpenAI并未放弃。

本周,OpenAI宣布对其自动化工具Codex进行全面升级,带来多项新功能,显著提升其能力。

周四,OpenAI发布了大量新特性,其中最引人注目的是Codex现在可以在电脑后台运行——能够打开桌面上的任意应用程序,并通过鼠标点击和键盘输入执行操作。

从功能上看,这意味着Codex可以部署多个代理,这些代理可以在用户的Mac上“并行工作,且不会干扰用户在其他应用中的操作”,公司在一篇博客文章中表示。换句话说,由于Codex在后台运行,用户可以继续使用电脑,而代理则独立完成任务。OpenAI称,这些代理将作为编程助手,帮助完成辅助性工作,让用户专注于核心项目。公司列举了“前端迭代、应用测试或在不支持API的应用中工作”等场景,作为此类代理辅助的潜在应用。

总体来看,这次代理功能的更新及其他新增内容,体现了OpenAI不仅希望让Codex成为有竞争力的编程助手,更希望它成为能够融入多种企业工作流程的多功能工具。

关注AI编程领域的人士还会注意到,OpenAI此次赋予Codex的一些能力,与Anthropic此前为Claude Code推出的功能颇为相似。上个月,Anthropic宣布Claude和Cowork可以远程控制用户的Mac和桌面,代替用户操作键盘。

除了代理工具,OpenAI的Codex还新增了内置浏览器,允许用户向代理发出指令,代理则在特定的网页应用上执行操作。OpenAI表示,这项功能对前端开发和游戏开发非常有用,未来计划扩展该能力,使Codex能够“全面控制浏览器,超越本地网页应用”。

此外,还有其他更新。一个名为“记忆”的预览功能使Codex能够回忆之前的工作内容,生成关于用户工作方式的重要上下文。代理还新增了图像生成能力,可用于创建产品概念、幻灯片视觉、模型图、占位图像及其他企业相关素材。为了扩展Codex的执行能力,OpenAI宣布集成了111个插件,涵盖CodeRabbit、GitLab Issues等应用,使Codex能够处理这些工具相关的任务。

OpenAI表示,这些插件赋予Codex执行轻量级文书工作的能力,帮助用户整理工作生活。例如,Codex现在可以查看你的Slack频道和Google日历,为你生成当天的待办事项清单。

OpenAI还推出了针对ChatGPT企业和商业客户的按使用量付费Codex定价选项,旨在为用户提供更灵活的采购方式。

曾被视为行业无可争议的领导者,OpenAI近月来与Anthropic的竞争愈发激烈,重点转向企业级能力,同时逐步放弃了诸如社交视频应用Sora 2等面向消费者的工具。公司还面临多起争议,包括因ChatGPT对部分用户心理健康影响而引发的诉讼。