开源界再迎重磅！Mistral Small4正式发布：三合一模型更强更高效？

发布时间：2026/3/18

在开源大模型领域，Mistral AI再次彰显了“效率优先”的理念。近日，该公司宣布正式开源其Small系列最新力作——Mistral Small4，采用Apache 2.0许可证发布，并同时宣布加入由NVIDIA发起成立的Nemotron联盟，成为创始成员之一。

这不仅仅是一次简单的升级。Mistral Small4被官方定义为首个“多功能三合一”模型，完美融合了Mistral家族此前引以为傲的三大旗舰能力：

Magistral：卓越的逻辑推理能力。
Pixtral：强大的原生多模态处理能力（支持图像输入）。
Devstral：专业的智能代理编码能力。

这意味着开发者无需再在“快速指令模型”、“重推理引擎”或“多模态助手”之间做选择，一个模型即可覆盖所有场景。

在技术规格上，Mistral Small4采用了精准的128专家混合专家模型（MoE）架构。尽管总参数量达到1190亿，但通过优化，每个token仅激活4个专家（约600亿活跃参数），大幅降低计算成本的同时保持性能表现。此外，超长的256k上下文窗口使其能够轻松应对长文档分析和复杂对话。

值得一提的是，该模型引入了“可配置推理强度”功能，用户可自由切换低延迟快速响应和深度推理输出。测试数据显示：

在延迟优化模式下，端到端完成时间缩短了40%。
在吞吐量优化模式下，每秒请求数（RPS）较上一代提升了3倍。

从代码补全到视觉分析，Mistral Small4的开源无疑为全球开发者提供了更灵活高效的“多面手基础模型”。当顶级推理能力与原生多模态结合，开源社区的创新天花板或将再次被刷新。

标签

#开源模型 #多模态技术 #人工智能 #大规模模型 #模型优化

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

中国日益留住顶尖人工智能人才

2026/05/28

中国日益留住顶尖人工智能人才

对于中国顶尖的人工智能研究人员来说，出境的限制正在逐渐加严。据报道，研究人员、初创企业创始人以及私营企业高管现在面临旅行限制，其中一些行业内最重要的人物必须获得政府批准才能出国。这些限制反映了北京在管理人工智能领域人才流失方面的更广泛转变。随着全球科技行业将人工智能视为新的增长点，对人才的需求激增，训练和优化人工智能模型的人才变得尤为抢手。 2025年3月，《华尔街日报》报道，中国当局已建议顶尖

日本游戏设计先驱森川幸人举办AI游戏咨询活动

2026/05/04

日本游戏设计先驱森川幸人举办AI游戏咨询活动

日本游戏设计师森川幸人将在BitSummit2026活动中提供游戏AI咨询，助力开发者探索AI应用。

东京地铁利用AI技术推进铁路变电所和电气室的状态基准维护

2026/05/28

东京地铁利用AI技术推进铁路变电所和电气室的状态基准维护

东京地铁宣布将通过AI技术实现铁路变电所和电气室的状态基准维护，提升安全性和维护效率。