中国大型模型SuperCLUE评测：斗宝跻身全球顶尖行列

发布时间：2026/3/31

中国权威大型模型评测基准SuperCLUE发布了最新综合报告。评测结果显示，字节跳动的斗宝-pro表现强劲，成功进入全球大型模型第一梯队，与国际顶尖模型直接竞争。

此外，小米秘密研发的MiMo大型模型首次登榜，吸引业界关注手机厂商自研大型模型的实力。

中国模型齐头并进：多维能力接近GPT-4

本次评测中，国内大型模型在中文语境理解、常识推理和逻辑演绎方面取得显著进展。斗宝不仅在基础对话质量上表现优异，还在复杂任务规划和长文本处理的稳定性上获得高分。

百度文心ERNIE Bot、阿里巴巴通义千问等模型依然保持领先，体现出头部企业在语料积累和对齐技术上的深厚积累。

值得注意的是，小米MiMo的入榜表明边缘侧AI与云端大型模型结合的路径日益可行，为未来手机交互带来更多可能。

差异化竞争：从通用智能走向垂直场景

评测报告指出，当前中国大型模型的竞争已不再单纯依赖参数规模，而是转向更细分的场景化竞争。

斗宝依托字节跳动生态流量优势，在内容创作和社交互动场景表现突出；而小米MiMo则在系统级调度和多设备协同方面展现独特优势。

SuperCLUE专家认为，随着模型能力趋于均衡，未来的关键在于谁能更有效地解决行业痛点，提供更低延迟、更具成本效益的算力服务。

标签

#大型模型 #人工智能 #中文理解 #技术评测 #手机厂商

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

东京大学学生生成式AI使用率达93.4%，匿名问卷应用用户突破500人

2026/07/10

东京大学学生生成式AI使用率达93.4%，匿名问卷应用用户突破500人

日本株式会社カルペ・ディエム发布了其运营的面向日本东京大学在校生的匿名问卷应用“东京大学生问卷”的最新调查结果。此次公布了从累计收集的问卷中提炼出的五组数据，展现了东京大学学生的真实面貌。同时，应用注册用户数已突破500人。关于生成式AI的使用情况，93.4%的学生表示有使用经历。其中，65.3%为日常使用，15.9%每周使用数次，11.4%偶尔使用。具体工具方面，使用率最高的是Gemini（

Meta新款AI芯片将于九月开始量产

2026/07/11

Meta新款AI芯片将于九月开始量产

为了应对前所未有的元件短缺并降低GPU成本，Meta计划于今年九月开始生产其最新版本的专用AI芯片。据路透社援引内部备忘录报道，至少有一款芯片在约六周内顺利通过了测试阶段。Meta与博通（Broadcom）合作设计芯片，但将由台湾半导体制造公司（TSMC）负责制造。此外，Meta还从三星采购内存，从闪迪（Sandisk）采购存储设备，并从住友电工采购光纤设备。今年三月，Meta详细介绍了其Met

TOPPAN等三家公司推动日本政府共通数据的AI准备化

2026/07/14

TOPPAN等三家公司推动日本政府共通数据的AI准备化

TOPPAN、NTT数据与Fides Policy & Strategy Consulting合作，推进日本数字厅“政府AI源内”项目，整备并AI准备化政府共通及领域特化数据集，制定AI数据集标准。