今天,微软Build大会带来了丰富的内容,除了回顾GitHub与智能代理的最新进展外,还发布了七款全新的MAI模型,包括MAI-Thinking-1、MAI-Code-1-Flash、MAI-Image-2.5、MAI-Transcribe-1.5和MAI-Voice-2等。

微软Build大会MAI模型阵容

这套阵容令人印象深刻,尤其考虑到微软与Inflection合作成立MAI仅两年时间,且所有模型均为自主预训练。MAI目前虽非顶尖前沿实验室,但作为二线新兴实验室,明显支持领域特定的微调,这与多数前沿实验室几乎放弃微调形成对比。

大会亮点之一是微软发布的超过100页的MAI技术报告,研究界对其透明度给予高度评价。

AI Twitter回顾

主要内容

微软利用Build大会展示了其作为AI平台公司和前沿模型实验室的双重身份,发布了七款涵盖推理、代码、图像、语音转录和语音的MAI模型。

  • 旗舰推理模型MAI-Thinking-1采用35亿活跃参数的MoE架构,支持256K上下文窗口,且未使用第三方模型蒸馏。
  • MAI-Code-1-Flash是一款针对VS Code和GitHub Copilot CLI的快速代码模型,拥有5亿参数,性能接近Haiku级别。
  • MAI-Image-2.5及其Flash版本在图像编辑排行榜中排名第二,超越Nano Banana 2。
  • MAI-Transcribe-1.5支持43种语言,具备极高的实时转录速度和准确率。
  • MAI-Voice-2也在发布列表中,但技术细节较少。

微软还强调了本地AI和Windows作为智能代理运行时的战略,推出了Surface RTX Spark开发盒子及概念硬件项目Solara和Scout。

GitHub Copilot应用被定位为“面向代理的桌面软件开发中心”,支持跨设备连续性和更紧密的代理工作流。

微软发布了Web IQ,一套面向AI代理的网页、新闻、图像和视频的基础搜索API,已支持包括Copilot和ChatGPT在内的多款主流聊天机器人。

MAI-Thinking-1技术细节

  • 35亿活跃参数的MoE模型,预训练使用了约30万亿tokens,训练硬件为8192块GB200 GPU。
  • 在AIME 2025测试中取得97%成绩,SWE-Bench Pro中得分53%,且盲测中优于Sonnet 4.6。
  • 优化运行于MAIA 200定制芯片,性能成本比提升30%,能效提升1.4倍。
  • 全流程无合成数据和无第三方蒸馏,数据来源包括Common Crawl和私有数据,且针对不同领域有专门的数据处理管线。

其他模型亮点

  • MAI-Code-1-Flash在SWE-Bench Pro中取得51%成绩,参数规模虽小但效率高。
  • MAI-Image-2.5在图像编辑领域表现优异,领先同类模型。
  • MAI-Transcribe-1.5支持多语言,转录速度极快,准确率高。

技术报告的独特价值

报告详细披露了训练流程、数据筛选、硬件利用率和模型架构,获得业界广泛认可,被称为“同规模模型中最透明的报告之一”,甚至被视为现代大规模语言模型训练的“更新版教科书”。

Build大会其他重点

  • GitHub Copilot应用及CLI新增终端UI、标签页、语音输入等功能,强化代理原生开发体验。
  • Windows被定位为智能代理的可信执行平台,支持本地运行大规模模型。
  • Web IQ为未来代理搜索提供基础设施,预计代理查询量将远超人类搜索。
  • Foundry平台拥有超过11000个模型,支持多模型托管与分发。
  • 数据中心扩展与AI计算能力预计未来三年增长1000倍。

观点与分析

  • 多数技术专家对微软的透明度和模型质量表示肯定,认为微软正从模型分销商转型为真正的前沿模型开发者。
  • 企业用户看重数据来源清晰、可控的微调能力。
  • 也有观点质疑部分参数和性能指标的解读,及零合成数据策略的长期适用性。

事件背景意义

此次Build大会表明微软不仅是Azure和GitHub的云端和开发平台,更正积极打造自有前沿模型、定制芯片、操作系统和开发工具的完整AI生态。

强调“清晰数据血统”和“无蒸馏”策略,回应企业对知识产权和模型可控性的关注。

推动本地AI运行,结合Windows生态,支持推理模型和智能代理在设备端运行,减少对云端依赖。

"Mythos FLOPs泄露"小插曲

大会期间有用户推测微软幻灯片泄露了Anthropic Claude Mythos模型的训练计算量,后被业内专家质疑为估算误读。

其他AI生态动态

  • OpenAI发布Sites in Codex,支持企业快速搭建内部网站和应用。
  • Anthropic推出Claude平台CLI及背景代理功能。
  • 多家公司发布本地推理模型和代理管理工具。
  • Google DeepMind发布基于Gemini的多代理科学假设生成系统。

综上,微软Build大会不仅展示了MAI系列模型的技术实力,也体现了其构建涵盖模型、芯片、云服务、操作系统和开发工具的全栈AI平台的战略决心。