Nano Banana

美国谷歌公司于2026年5月29日(当地时间)正式发布了图像生成AI模型“Nano Banana 2”(Gemini 3.1 Flash Image)和“Nano Banana Pro”(Gemini 3 Pro Image),向开发者和企业开放使用。这两款模型可通过“Google AI Studio”以及“Gemini Enterprise Agent Platform”的API接口调用。

“Nano Banana”系列是谷歌推出的图像生成AI模型,能够根据文本提示生成高质量图像,也支持对现有图像进行编辑。其中,“Nano Banana 2”定位于高速处理,而“Nano Banana Pro”则专注于更高质量的图像输出。用户不仅可以通过“Gemini”应用使用这些模型,还能通过API将图像生成和编辑功能直接集成到自己的应用程序和工作流程中。

此次正式发布中,“Nano Banana 2”新增支持视频文件作为输入,虽然目前仍处于预览阶段,但它能够分析视频中的视觉内容、主体和动作,从而生成符合上下文的缩略图或信息图表等图像,极大增强了模型的多模态处理能力。

两款模型均支持1K和2K分辨率的图像输出,4K分辨率则作为预览功能提供。

谷歌官方推特也宣布了这一消息,表示这两款顶级图像生成模型现已向开发者和企业开放。