#本地大模型

按标签聚合查看文章内容。

2026/04/07

本文介绍如何在 CPU / Mac 上通过 llama.cpp 与 GGUF 格式本地运行 DeepSeek，包括支持的模型、量化等级与内存匹配、Mac/CPU 编译安装步骤、命令行聊天与本地 API 服务器示例，以及在量化条件下的性能优化与质量权衡。

2026/04/02

Ollama最新更新引入苹果自研MLX框架，大幅提升搭载苹果芯片Mac本地大模型性能，响应速度提升至两倍，M5芯片表现尤为突出。