大型模型时代的下半场,不再仅仅依赖计算力的堆叠,而是需要对底层逻辑进行重构。

在2026年3月18日举办的NVIDIA GTC大会上,Moonshot AI创始人杨志林发表了备受期待的公开演讲,首次系统披露了Kimi K2.5模型背后的核心技术路线图,带来了关于大型模型“后扩展”时代演进的新视角。

杨志林在演讲中指出,要突破智能的极限,必须彻底重构优化器、注意力机制和残差连接等关键技术。他将Kimi模型的演进路径总结为三个协同发展的关键维度:

  • 令牌效率:拒绝资源闲置,追求更极致的计算效率比。
  • 长上下文:持续强化Kimi的长期记忆优势,以处理海量信息。
  • 智能体集群:智能形态正从单体作战演变为动态生成的“数字集群”。

在杨志林看来,当前的扩展已转向在效率、内存和自动协作中寻找规模效应。如果这三个维度的技术增益能够实现乘法效应,模型将释放远超现有水平的智能能力。

据此前发布的信息,今年1月初推出的Kimi K2.5已展现出这种“全方位”能力。作为Moonshot AI迄今为止最强大的开源模型,它采用原生多模态架构,在代码和视觉理解方面达到业界领先水平,同时支持“思考”与“非思考”模式的灵活切换,精准适配智能体任务场景。

随着Moonshot AI技术秘密的揭示,大型模型领域的竞争焦点正从“参数数量”转向“智能密度”。当智能体集群成为未来智能的终极形态,Kimi能否在杨志林提出的“三维乘法”逻辑下实现飞跃,已成为业界关注的焦点。