微软正向AI图像生成领域的领军者发起挑战。周二,微软发布了两款全新的文本生成图像模型,名为MAI-Image-2.5,作为下一代AI模型系列的一部分。那么,它与业界标杆谷歌的Nano Banana相比表现如何?

提到微软及其AI产品如Copilot,许多人可能不会首先联想到创意工作。这两款新模型——常规版2.5和更快的Flash版——正是为了改变这一印象而设计。

微软AI负责人Mustafa Suleyman在Build大会主旨演讲中表示:“它们提供精准的编辑能力,兼具卓越的控制力和一致性。Flash版适合高效生产工作负载,而2.5版则追求最高的图像质量和专业级表现。”

这两款模型是微软在Build开发者大会上发布的七款新AI模型中的一部分。大会还推出了首个“推理”模型MAI-Thinking-1,该模型能花更多时间和迭代次数来生成更优质的回答或解决更复杂的问题。此外,微软还发布了新一代语音和转录模型,以及针对GitHub优化的编程模型。微软还展示了其对未来计算的愿景,核心聚焦于智能代理AI。

目前,这款新图像模型已在PowerPoint和企业市场Foundry上线,并正在OneDrive中逐步推广。

那么,微软最新的AI图像模型与竞争对手相比表现如何?

MAI-Image-2.5与Nano Banana 2,谁更强?

自2025年发布以来,谷歌的Nano Banana一直主导着创意AI图像领域,凭借其行业领先的能力,成为生成图像的黄金标准。微软宣布其新模型在某一关键指标上超越了Nano Banana,令人颇感意外。

根据知名AI模型评测平台Arena AI排行榜,微软的MAI-Image-2.5在图像编辑能力上优于Nano Banana 2。但微软暂居第二名,第一名由OpenAI的GPT-Image-2占据。

不过,AI模型的实用价值不仅取决于单一的评测指标,易用性同样重要。一个简单的问题决定了你更适合使用哪款模型:你是使用PowerPoint还是Google幻灯片?微软和谷歌各自AI模型的可访问性将影响你的选择。如果你计划将AI生成的图像用于商业用途,还需确认相关使用权,尤其是企业版和个人版的权限差异。