上个月,继《华尔街日报》的报道之后,OpenAI确认正在开发一款桌面超级应用,将ChatGPT、Codex编码代理和Atlas网页浏览器整合为一体,打造统一的使用体验。虽然这款应用尚未发布,但OpenAI推出了Codex的重大更新,极大地提升了软件的能力,也让我们得以一窥其未来超级应用的蓝图。

Codex负责人Thibault Sottiaux在OpenAI的新闻发布会上表示:“我们正在公开构建这款超级应用。这次发布主要面向开发者,未来将面向更广泛的用户。”最新版本的Codex为开发者提供了多功能的AI代理,能够在更广泛的应用场景中主动工作,尤其是在电脑操作方面带来了诸多新功能。

Codex中的AI代理可以与电脑上的其他应用程序交互。用户在调用OpenAI模型时,可以指定具体程序,也可以让模型自动选择最合适的应用。虽然类似功能在竞争产品如Claude Cowork中也有体现,但OpenAI认为Codex的优势在于其“秘密武器”——能够让代理运行应用时不会拖慢整个系统,从而实现高效协作。同时,OpenAI还发布了111个新的插件,这些插件结合了技能、应用集成和模型上下文协议服务器连接,赋予Codex更多获取上下文和使用开发者依赖工具的能力。

此外,OpenAI为Codex新增了内置浏览器和评论系统,用户可以通过提示让Codex调整网页或网页应用的特定部分。例如,在演示中,Codex团队成员指示Codex修改图表边距,避免y轴被截断。配合这一功能的是内置的图像生成能力,Codex可以利用gpt-image-1.5生成产品概念、原型设计、前端界面甚至简单游戏素材,还能通过截图确认是否正确理解用户需求。

此次更新还预览了两项记忆功能。第一项允许Codex记忆之前任务的上下文,从而优化后续请求的处理速度和质量。第二项则基于收集的上下文,主动建议用户采取行动,比如提醒你回复同事在Google文档草稿上的评论。

如果你想亲自体验更新后的Codex,OpenAI已开始向使用ChatGPT账户登录的桌面应用用户推送新版本。电脑操作功能首先面向macOS用户开放,随后将扩展至欧盟和英国用户。记忆功能也将在英国和欧洲地区逐步上线。