在过去四个月里,AI行业发生了诸多变化。自OpenAI发布ChatGPT Images 1.5以来,我们见证了智能代理工具的激烈竞争、与五角大楼达成的前所未有合作协议,以及AI内容泛滥带来的挑战。

如今,OpenAI重返生成式媒体领域,宣布推出下一代图像模型——ChatGPT Images 2。

令人意外的是,OpenAI在宣布关闭曾经风靡一时的Sora AI视频应用,仅一个月后便发布了这一新模型。关闭Sora的目的是专注于打造面向企业的“核心产品”,而从新模型的设计理念来看,OpenAI并未偏离这一目标。

ChatGPT Images 2专为生成包含大量文字的图像而设计,如信息图表、科学海报、学习指南和营销材料。过去那些奇怪的Sora视频和宫崎骏风格的网络迷因已经成为过去。

OpenAI现在致力于开发能够完成“经济价值创造性任务”的AI。

ChatGPT Images产品负责人Adele Li在新闻发布会上表示:“视觉智能的应用场景极为广泛,我们认为这对ChatGPT打造个人助理的愿景至关重要,因为创意助理是个人身份的重要组成部分。”

(声明:CNET母公司Ziff Davis于2025年4月对OpenAI提起诉讼,指控其在训练和运营AI系统时侵犯了版权。)

OpenAI一直在追求打造一站式AI超级应用的梦想,基于其Codex平台构建。ChatGPT Images 2正是这一拼图中的创意部分。

新模型在排版、图标设计和构图方面有显著提升,能够生成更专业的AI图像,并支持多语言文本生成。众所周知,AI图像模型在生成清晰且准确的文字方面存在困难,而ChatGPT Images 2是OpenAI迄今为止表现最好的模型。谷歌此前通过Nano Banana Pro提升了文本渲染,但即便如此,其准确性仍有限。

ChatGPT Images 2现已向所有用户开放,生成次数取决于用户订阅计划,付费越多,生成次数越多。

开发者通过API可生成2K和4K分辨率图像,尽管高分辨率功能仍处于测试阶段,可能存在不稳定情况。付费用户还可使用具备思考和推理能力的模型,帮助他们搜索网络信息、整理成易读设计并进行校对。

虽然称其为“图像模型”技术上无误,但ChatGPT Images 2并不追求Midjourney那样的超现实艺术效果,也不具备Adobe Firefly那样丰富的编辑工具。

它面向的是介于Midjourney艺术爱好者和Adobe专业创作者之间的用户群体——那些需要制作吸引人内容的专业人士。

类似Anthropic新推出的Claude Design,ChatGPT Images 2主要服务于职场用户。教师可以用它制作学习指南和插图教案,市场经理则能创建社交媒体帖子和视觉素材。

用户可从单一提示生成最多八张图像,保持视觉风格一致,适合制作多页报告。

缺点是若需调整图像,仍需重新生成。文字密集的设计更可能需要多次修改,因此使用额度消耗较快。OpenAI表示将继续优化基于提示的迭代编辑流程,确保操作简便。

OpenAI的安全措施与之前的图像模型相似,依然通过C2PA标准附加元数据,确保AI图像来源可追溯。公司政策禁止滥用和非法图像,这在当前AI深度伪造和未经同意的私密图像事件频发的背景下尤为重要。