ChatGPT Images 2：OpenAI为何在终止Sora后打造全新图像模型

在过去四个月里，AI行业发生了诸多变化。自OpenAI发布ChatGPT Images 1.5以来，我们见证了智能代理工具的激烈竞争、与五角大楼达成的前所未有合作协议，以及AI内容泛滥带来的挑战。

如今，OpenAI重返生成式媒体领域，宣布推出下一代图像模型——ChatGPT Images 2。

令人意外的是，OpenAI在宣布关闭曾经风靡一时的Sora AI视频应用，仅一个月后便发布了这一新模型。关闭Sora的目的是专注于打造面向企业的“核心产品”，而从新模型的设计理念来看，OpenAI并未偏离这一目标。

ChatGPT Images 2专为生成包含大量文字的图像而设计，如信息图表、科学海报、学习指南和营销材料。过去那些奇怪的Sora视频和宫崎骏风格的网络迷因已经成为过去。

OpenAI现在致力于开发能够完成“经济价值创造性任务”的AI。

ChatGPT Images产品负责人Adele Li在新闻发布会上表示：“视觉智能的应用场景极为广泛，我们认为这对ChatGPT打造个人助理的愿景至关重要，因为创意助理是个人身份的重要组成部分。”

（声明：CNET母公司Ziff Davis于2025年4月对OpenAI提起诉讼，指控其在训练和运营AI系统时侵犯了版权。）

OpenAI一直在追求打造一站式AI超级应用的梦想，基于其Codex平台构建。ChatGPT Images 2正是这一拼图中的创意部分。

新模型在排版、图标设计和构图方面有显著提升，能够生成更专业的AI图像，并支持多语言文本生成。众所周知，AI图像模型在生成清晰且准确的文字方面存在困难，而ChatGPT Images 2是OpenAI迄今为止表现最好的模型。谷歌此前通过Nano Banana Pro提升了文本渲染，但即便如此，其准确性仍有限。

ChatGPT Images 2现已向所有用户开放，生成次数取决于用户订阅计划，付费越多，生成次数越多。

开发者通过API可生成2K和4K分辨率图像，尽管高分辨率功能仍处于测试阶段，可能存在不稳定情况。付费用户还可使用具备思考和推理能力的模型，帮助他们搜索网络信息、整理成易读设计并进行校对。

虽然称其为“图像模型”技术上无误，但ChatGPT Images 2并不追求Midjourney那样的超现实艺术效果，也不具备Adobe Firefly那样丰富的编辑工具。

它面向的是介于Midjourney艺术爱好者和Adobe专业创作者之间的用户群体——那些需要制作吸引人内容的专业人士。

类似Anthropic新推出的Claude Design，ChatGPT Images 2主要服务于职场用户。教师可以用它制作学习指南和插图教案，市场经理则能创建社交媒体帖子和视觉素材。

用户可从单一提示生成最多八张图像，保持视觉风格一致，适合制作多页报告。

缺点是若需调整图像，仍需重新生成。文字密集的设计更可能需要多次修改，因此使用额度消耗较快。OpenAI表示将继续优化基于提示的迭代编辑流程，确保操作简便。

OpenAI的安全措施与之前的图像模型相似，依然通过C2PA标准附加元数据，确保AI图像来源可追溯。公司政策禁止滥用和非法图像，这在当前AI深度伪造和未经同意的私密图像事件频发的背景下尤为重要。

ChatGPT Images 2：OpenAI为何在终止Sora后打造全新图像模型

标签

评论

相关阅读

TechCrunch出行：汽车行业的AI技能竞赛即将来临

日本TISI与AtStream Consulting发布面向系统规划构想流程的AI代理实证成果

微软Copilot AI被曝一键泄露2FA验证码，助黑客窃取账户