
日本国家Element Labs于5月22日发布了包含MTP Speculative Decoding稳定版的本地LLM软件最新版本「LM Studio 0.4.14(Build 4)」。目前该版本支持Qwen 3.6系列模型。
MTP(Multi-Token Prediction)Speculative Decoding是一种通过轻量级模型预测未来多个token,并由目标模型验证预测结果,从而在保证输出质量的同时实现加速的技术。目前支持的模型包括Qwen3.6-35B-A3B-MTP-GGUF和Qwen3.6-27B-MTP-GGUF等。此外,该技术也支持GGUF格式和llama.cpp模型,未来将扩展更多兼容模型。
本次更新还修复了启用MTP时非MTP Speculative Decoding错误的问题,以及“lms get gemma4”命令无结果显示的故障。同时,“lms chat”命令新增功能,可查看各远程模型所在的LM Link设备,提升了管理便利性。


