中国大模型正加速实现从“追随者”到“并跑者”甚至“领跑者”的转变。

2026年3月30日,中文大模型基准评测SuperCLUE发布了最新的3月评测结果。本次评测涵盖了国内外22个主流模型,涉及数学推理、科学推理、代码生成等六大核心任务。结果显示,以“斗宝”为代表的国产模型成功跻身全球顶尖行列。

全球视角:海外闭源模型依旧强势,斗宝紧随其后

在本次评测的整体排名中,海外闭源模型依然展现出强劲的技术实力:

  • 前三名:Anthropic的Claude-Opus-4.6、谷歌的Gemini-3.1-Pro和OpenAI的GPT-5.4分别位列全球第一、第二和第三。

  • 国产亮点:字节跳动的斗宝(Doubao-Seed-2.0-pro)以71.53分位居国内第一,不仅稳居全球顶尖梯队,还将与GPT-5.4的分差缩小至仅0.95分。

  • 智能体突破:在智能体任务规划维度,斗宝甚至超越部分海外模型,进入全球前五。

小米表现:MiMo-V2系列数学推理成绩亮眼

作为主要手机厂商进军AI的代表,小米集团的MiMo系列在本次评测中表现稳健:

  • 数学明星:MiMo-V2-Pro在闭源模型中名列前茅,获得60.67分,数学推理任务中更是取得了84.03的高分。

  • 双模上榜:除了Pro版本,开源版本MiMo-V2-Flash也榜上有名,在代码生成等特定场景展现出不俗潜力。

开源赛道:国产模型实现“全方位”领先

相比闭源领域的激烈竞争,国产模型在开源赛道展现出明显优势:

  • 前三甲:国产开源模型如Kimi-K2.5-Thinking和Qwen3.5-397B占据开源排行榜前三名。

  • 强势下击:评测数据显示,国产开源模型显著超越海外同类,成为全球开发者的新宠。

总结:从“参数竞赛”迈向“实用能力”

从2026年3月发布的这份排名可以看出,中国大模型不再仅仅聚焦于中文语境理解,而是直接在逻辑推理、代码生成等硬核领域与全球顶尖模型展开竞争。斗宝持续攀升,小米MiMo也展现出强劲实力,标志着国产AI正迎来质的飞跃。