Google Cloud Nano Banana

日本Google Cloud宣布,在其生成与对话型AI“Gemini”中搭载的图像生成与编辑AI模型“Nano Banana 2(Gemini 3.1 Flash Image)”和“Nano Banana Pro(Gemini 3 Pro Image)”现已通过“Gemini Enterprise Agent Platform”向公众开放使用。

此次发布不仅实现了模型的一般提供,还以预览版形式引入了Nano Banana 2的新功能。该功能支持视频文件作为输入提示,除了文本、PDF和图像输入外,还能分析视频的上下文、主体和动作,从而生成缩略图和丰富的信息图像。目前,1K和2K分辨率的输出功能已正式开放,4K输出功能仍处于预览阶段。

目前,多家企业已开始采用Nano Banana模型。日本Adobe将其集成到“Firefly”和“GenStudio”中;WPP将其整合进代理型营销平台“WPP Open”;Shopify向销售商提供这两款模型;URBN利用其图像生成与编辑功能;Magnopus则在其空间智能平台“OKO”中的“Nodey”项目中应用该技术。

应用场景示意

模型功能展示

通过Gemini Enterprise Agent Platform,企业用户能够访问实现Nano Banana 2和Nano Banana Pro大规模部署所需的技术和商业框架,并享受企业级服务协议(SLA)提供的全面支持。

此外,虽然开发者不包含在企业SLA服务范围内,但仍可通过Gemini API调用这些模型进行使用。