中国权威大型模型评测基准SuperCLUE发布了最新综合报告。评测结果显示,字节跳动的斗宝-pro表现强劲,成功进入全球大型模型第一梯队,与国际顶尖模型直接竞争。
此外,小米秘密研发的MiMo大型模型首次登榜,吸引业界关注手机厂商自研大型模型的实力。
中国模型齐头并进:多维能力接近GPT-4
本次评测中,国内大型模型在中文语境理解、常识推理和逻辑演绎方面取得显著进展。斗宝不仅在基础对话质量上表现优异,还在复杂任务规划和长文本处理的稳定性上获得高分。
百度文心ERNIE Bot、阿里巴巴通义千问等模型依然保持领先,体现出头部企业在语料积累和对齐技术上的深厚积累。

值得注意的是,小米MiMo的入榜表明边缘侧AI与云端大型模型结合的路径日益可行,为未来手机交互带来更多可能。
差异化竞争:从通用智能走向垂直场景
评测报告指出,当前中国大型模型的竞争已不再单纯依赖参数规模,而是转向更细分的场景化竞争。
斗宝依托字节跳动生态流量优势,在内容创作和社交互动场景表现突出;而小米MiMo则在系统级调度和多设备协同方面展现独特优势。
SuperCLUE专家认为,随着模型能力趋于均衡,未来的关键在于谁能更有效地解决行业痛点,提供更低延迟、更具成本效益的算力服务。


