本地LLM加速：LM Studio的“MTP”功能发布稳定版

发布时间：2026/5/26

LM Studio界面

日本国家Element Labs于5月22日发布了包含MTP Speculative Decoding稳定版的本地LLM软件最新版本「LM Studio 0.4.14(Build 4)」。目前该版本支持Qwen 3.6系列模型。

MTP（Multi-Token Prediction）Speculative Decoding是一种通过轻量级模型预测未来多个token，并由目标模型验证预测结果，从而在保证输出质量的同时实现加速的技术。目前支持的模型包括Qwen3.6-35B-A3B-MTP-GGUF和Qwen3.6-27B-MTP-GGUF等。此外，该技术也支持GGUF格式和llama.cpp模型，未来将扩展更多兼容模型。

本次更新还修复了启用MTP时非MTP Speculative Decoding错误的问题，以及“lms get gemma4”命令无结果显示的故障。同时，“lms chat”命令新增功能，可查看各远程模型所在的LM Link设备，提升了管理便利性。

标签

#本地LLM #模型加速 #MTP技术 #LM Studio #Qwen模型

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

谷歌DeepMind与A24达成7500万美元合作，押注好莱坞AI未来

2026/06/22

谷歌DeepMind与A24达成7500万美元合作，押注好莱坞AI未来

好莱坞电影公司与科技巨头之间建立了一项全新联盟。周一，谷歌DeepMind宣布对知名独立电影制片厂A24投资7500万美元。A24以《马蒂至尊》、《瞬息全宇宙》和最新大片《密室逃生》等作品闻名。谷歌DeepMind将此次投资定位为合作伙伴关系，称这是“首创”的合作模式，双方将共同开发电影制作的人工智能工具，谷歌DeepMind也将从顶尖艺术家那里获得反馈和指导。A24近期与蒂莫西·查拉梅和安妮·

OpenAI启动全面行动修复开源漏洞，挑战Anthropic的Mythos模型

2026/06/22

OpenAI启动全面行动修复开源漏洞，挑战Anthropic的Mythos模型

随着人工智能行业的快速发展，关键的开源项目面临着被落后的风险。为应对这一挑战，OpenAI于周一宣布启动名为“Patch the Planet”的计划。该计划由专注于安全研究的知名公司Trail of Bits发起，并与漏洞管理公司HackerOne和Calif合作开展。该项目已开始为开源维护者提供免费的安全咨询服务，帮助他们发现并修复漏洞，同时支持加强代码库安全，推动将AI安全工具融入开发流程

OpenClaw引发的自律型AI代理热潮进入轻量化与安全竞赛的群雄割据时代

2026/07/14

OpenClaw引发的自律型AI代理热潮进入轻量化与安全竞赛的群雄割据时代

在前篇中，我们介绍了如何仅通过网页浏览器操作，运行拥有记忆功能的开源AI代理“Hermes Agent”。自律型AI代理只需事先设定指令，便能自主完成调查、通知和文件操作等任务。相比传统的聊天界面，这类代理能处理更广泛的任务，因此备受关注。这股潮流最早可追溯到2026年初引发社会现象的“OpenClaw”。本篇将介绍从OpenClaw衍生出的自律型AI代理全貌，以及不可回避的安全问题。 Op