ChatGPT Images 2.0

日本国家OpenAI于4月21日发布了“ChatGPT Images 2.0”,这是首个具备思考功能的图像生成模型,支持多语言,面向ChatGPT、Codex及API的所有用户开放。

细节处理

新版模型能够理解并关联多个对象,按照细致指令进行布局和文本渲染,支持多种长宽比的图像生成。它利用扩展的视觉知识和世界知识,自动补全图像中的不足部分,生成更完整的画面。

用户在ChatGPT中选择思考型或专业模型后,系统可从网络检索信息,生成并推荐多张不同风格的图片。思考功能还能帮助模型自我校验输出内容,确保准确性、时效性和一致性。

复杂细节处理

借助思考功能,模型能处理复杂细节,如小字体、图标、用户界面元素、密集构图及细微风格限制,最高支持2K分辨率渲染,生成不仅模糊的概念图,而是可实际应用的高质量图像。

日本国家OpenAI表示,虽然在英语及其他拉丁字母语言中表现较为稳定,但在非拉丁文字语言上的准确度曾有所下降。此次“ChatGPT Images 2.0”显著提升了日语、韩语、中文、印地语、孟加拉语等非拉丁文字的文本渲染能力,能够生成从海报、说明文到图表和漫画等多样内容。

多语言支持