#Google DeepMind

按标签聚合查看文章内容。

Google DeepMind发布Gemma 4的量化感知训练(QAT)模型,大幅降低内存消耗,手机端也能高效运行AI资讯

Google DeepMind发布Gemma 4的量化感知训练(QAT)模型,大幅降低内存消耗,手机端也能高效运行

美国Google DeepMind于6月5日(当地时间)发布了开源模型「Gemma 4」系列的“量化感知训练”(Quantization-Aware Training,简称QAT)检查点。该技术旨在大幅减少内存使用量,同时保持模型质量,适用于「E2B」「E4B」「12B」「26B MoE」「31B」等所有模型。 自今年4月发布以来,Gemma 4不断扩展功能,包括引入加速推理的“多标记预测”(M