距离AI工程师世界博览会常规门票售罄还有6天——这是全球规模最大的AI工程师、创始人、领导者和研究人员聚会。会议议程精彩纷呈,欢迎加入。
自今年2月以来,我们一直关注Z.ai发布的GLM 5系列模型。GLM-5.1为小幅升级版本,而最新发布的GLM-5.2则在多个评测中超越了DeepSeek、Mistral、Cohere和Moonshot等顶尖开源模型,尤其在前端编码领域表现突出。

第三方评测验证了官方离线测试结果,GLM-5.2仅次于Opus 4.8,成为全球最佳编码模型之一。值得注意的是,GLM-5.2在前端编码任务中击败了所有Opus版本,包括4.8,这一领域是模型竞争的关键战场。

技术细节方面,GLM-5.2基于DeepSeek稀疏注意力机制,结合创新的IndexShare技术,显著提升了超长上下文的推理效率。

主要亮点
- 开源许可:MIT许可,权重公开,支持下载、微调和本地部署。
- 模型规模:总参数量7440亿,单令牌激活参数400亿,采用专家混合(MoE)架构。
- 上下文窗口:支持高达100万令牌的超长上下文。
- 推理优化:IndexShare复用索引器,降低1M上下文下每令牌计算量近3倍。
- 推测解码:改进多令牌预测(MTP)机制,推测解码接受率提升20%。
- 推理成本:API定价与GLM-5.1持平,输入输出均约1.4美元/百万令牌和4.4美元/百万令牌。
评测表现
- FrontierSWE排名第三,领先GPT-5.5。
- Design Arena排名第一,超越Claude Fable 5。
- Agent Arena开放模型排名第一。
- Code Arena前端编码排名第二,领先Claude Opus 4.7。
- Terminal-Bench 2.1得分81.0,首次突破80分大关。
技术创新
- IndexShare稀疏注意力:每四层共享一个索引器,极大降低计算开销,提升超长上下文的实用性。
- 推理模式:提供“high”和“max”两种推理模式,兼顾性能与效率。
- 强化学习防作弊机制:通过LLM判定工具调用意图,阻断异常行为,避免奖励欺诈,保证训练稳定。
业界反响
- 许多开发者认为GLM-5.2是首个可替代Opus/GPT级别工作流的开源模型。
- 也有专家呼吁更多长距离任务的独立评测以验证模型的泛化能力。
- 业界普遍认为GLM-5.2代表了开源模型在编码和智能代理领域的重大突破。
生态支持
- 发布当天即获得Transformers、vLLM、SGLang、Cloudflare Workers AI、OpenRouter、Ollama Cloud、Baseten、DeepInfra、Fireworks、Notion等多平台支持。
未来展望
GLM-5.2的发布正值长上下文编码和智能代理任务日益重要的时期,开源权重的MIT许可为用户提供了极大自由,尤其在当前地缘政治限制日益严峻的背景下,开源模型的战略价值凸显。未来,期待更多关于模型在更广泛领域的表现和更长任务轨迹的验证。
更多详情和社区讨论可访问AI Engineer World’s Fair官网及相关推特账号。


