#Qwen模型

按标签聚合查看文章内容。

本地LLM加速:LM Studio的“MTP”功能发布稳定版AI资讯

本地LLM加速:LM Studio的“MTP”功能发布稳定版

日本国家Element Labs于5月22日发布了包含MTP Speculative Decoding稳定版的本地LLM软件最新版本「LM Studio 0.4.14(Build 4)」。目前该版本支持Qwen 3.6系列模型。 MTP(Multi-Token Prediction)Speculative Decoding是一种通过轻量级模型预测未来多个token,并由目标模型验证预测结果,从而