微软首席人工智能官Mustafa Suleyman宣布推出第二代图像生成模型MAI-Image-2。该模型在权威的LMArena评测中表现出色,直接跃升至全球第三名。
在被誉为AI图像生成领域“最高竞技场”的LMArena排名中,MAI-Image-2紧随谷歌的Gemini-3.1-flash-image-preview和OpenAI的GPT-image-1.5-high-fidelity之后。相比2025年10月发布的第一代模型(当时排名第九),第二代产品在整体质量上实现了关键突破。
技术亮点:解决行业痛点“文本损坏”问题
MAI-Image-2不仅大幅提升了视觉效果,还攻克了AI生成图像中长期存在的文本渲染难题:

- 精准文本渲染:显著增强了处理信息图表、演示幻灯片及复杂逻辑图中包含文本的能力,文字清晰且无损坏。
- 超逼真效果:能够准确还原自然光照、真实肤色,并构建符合物理规律的逼真环境。
- 电影级构图:支持生成超高分辨率图像,具备超现实概念、精细构图和宏大世界观。
微软正加快将这一顶尖能力推向用户:
- 即时体验:用户现可登录MAI Playground平台免费试用。
- 产品集成:MAI-Image-2正逐步整合进Copilot和Bing图像创作工具,未来将使大量普通用户在日常工作和创作中直接受益。
此次发布标志着微软已稳居多模态生成领域第一梯队。通过解决文本渲染这一核心痛点,进一步拓展了AI图像生成在专业办公领域的应用场景。


