第11回：什么是“开放权重模型”——人人可用的AI模型有何不同？

AI模型示意图

“开放权重模型”（Open-weights model）指的是公开了AI模型通过学习获得的“参数（权重）”数据，用户可以下载到自己的环境中进行运行和修改的AI模型。

代表性的开放权重模型包括日本Meta公司的Llama系列、DeepSeek的Deepseek系列、中国日本阿里云的Qwen开放权重版本，以及OpenAI的gpt-oss等。

AI可根据特定行业的风格调整，且可在自有服务器或电脑上运行

当前主流的AI大语言模型（LLM）会将文本拆分为“Token”这种小单位，通过大量文本学习，掌握词语排列和上下文模式，这些信息以庞大的数值形式存在，称为“参数”或“权重”。

当用户输入问题时，LLM会将其拆分为Token，利用已学习的权重计算上下文，并逐个生成最可能出现的下一个Token。通过不断重复此过程，模型能够生成自然流畅的回答。

而公开了“已学习权重”的模型即为开放权重模型。用户可以在自己的电脑或服务器上运行这些模型，甚至根据需求进行额外训练（微调），打造专门针对特定业务的AI，或进行个性化调整。这意味着无需从零开始构建AI，而是基于已有模型进行定制，例如调整以适应自家产品名称、行业专用术语或固定的回答风格。

此外，在本地环境或自有服务器运行AI，避免了将机密数据发送到外部服务器，增强了数据隐私保护，同时在处理大量任务时也可能降低成本。

不过，仅仅公开权重并不意味着该模型就是“开源AI”。不同模型在学习数据、训练代码、开发过程、许可条件等方面的公开程度和使用权限各不相同。

开放权重模型和“开源AI”常被混淆，但两者应区别对待。部分开放权重模型接近开源AI，但也有模型虽然公开了权重，却对商业使用或再分发有限制。