LM Studio界面

美国Element Labs于5月20日发布了本地大型语言模型(LLM)软件“LM Studio”的最新测试版——LM Studio 0.4.14 (Build 2)。此次更新引入了MTP(多标记预测,Multi-Token Prediction)技术,实现了投机性解码,显著提升了支持该功能模型的运行速度。

新版本支持包括Qwen 3.6和Gemma 4等最新模型,特别是在并行处理时,速度提升可达两倍左右。

用户可以通过软件左下角的设置(齿轮图标)进入“General”菜单,切换“Update channel”为“测试版”来更新软件。此外,使用MTP功能不仅需要更新LM Studio本体,还需将运行时环境(Runtime)升级到测试版v2.15.0。同时,用户需重新下载支持MTP的模型版本,并在加载模型时启用“MTP Speculative Decoding”选项。

值得一提的是,针对MTP支持模型在聊天界面中出现的空白字符被错误删除的BUG,Element Labs已发布了修复该问题的LM Studio 0.4.14 (Build 3)版本。

LM Studio性能提升示意