如何扩展大型模型？杨志林在GTC的首次亮相：押注令牌效率与智能体集群

发布时间：2026/3/21

大型模型时代的下半场，不再仅仅依赖计算力的堆叠，而是需要对底层逻辑进行重构。

在2026年3月18日举办的NVIDIA GTC大会上，Moonshot AI创始人杨志林发表了备受期待的公开演讲，首次系统披露了Kimi K2.5模型背后的核心技术路线图，带来了关于大型模型“后扩展”时代演进的新视角。

杨志林在演讲中指出，要突破智能的极限，必须彻底重构优化器、注意力机制和残差连接等关键技术。他将Kimi模型的演进路径总结为三个协同发展的关键维度：

令牌效率：拒绝资源闲置，追求更极致的计算效率比。
长上下文：持续强化Kimi的长期记忆优势，以处理海量信息。
智能体集群：智能形态正从单体作战演变为动态生成的“数字集群”。

在杨志林看来，当前的扩展已转向在效率、内存和自动协作中寻找规模效应。如果这三个维度的技术增益能够实现乘法效应，模型将释放远超现有水平的智能能力。

据此前发布的信息，今年1月初推出的Kimi K2.5已展现出这种“全方位”能力。作为Moonshot AI迄今为止最强大的开源模型，它采用原生多模态架构，在代码和视觉理解方面达到业界领先水平，同时支持“思考”与“非思考”模式的灵活切换，精准适配智能体任务场景。

随着Moonshot AI技术秘密的揭示，大型模型领域的竞争焦点正从“参数数量”转向“智能密度”。当智能体集群成为未来智能的终极形态，Kimi能否在杨志林提出的“三维乘法”逻辑下实现飞跃，已成为业界关注的焦点。

标签

#大型模型 #智能体集群 #令牌效率 #长上下文 #技术路线

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

诺贝尔奖得主约翰·贾姆珀离开DeepMind加盟竞争对手Anthropic

2026/06/21

诺贝尔奖得主约翰·贾姆珀离开DeepMind加盟竞争对手Anthropic

约翰·贾姆珀（John Jumper），这位最近获得诺贝尔化学奖的科学家，于周五宣布，在谷歌DeepMind工作近九年后，将跳槽至竞争对手Anthropic。贾姆珀在社交平台X上表示，DeepMind的CEO德米斯·哈萨比斯（Demis Hassabis）在他博士毕业仅六个月后就大胆让他领导AlphaFold团队，而整个谷歌DeepMind团队也教会了他如何开展卓越的科学研究。贾姆珀（右图中右

Meta推出全新AI图像工具，我用它在Instagram上制作了好友的深度伪造图像

2026/07/08

Meta推出全新AI图像工具，我用它在Instagram上制作了好友的深度伪造图像

Meta发布了名为Muse Image的新AI模型，支持生成和编辑AI图像，现已在Instagram等平台上线。公开账号用户需调整设置，防止被他人利用AI制作深度伪造图像。

WeCom CLI正式开源：开放七大核心能力，支持主流AI代理直接调用

2026/03/31

WeCom CLI正式开源：开放七大核心能力，支持主流AI代理直接调用

WeCom开源CLI项目开放消息、日程、文档等七大核心能力，助力开发者快速构建办公场景下的AI应用。