#Google DeepMind

2026/06/08

Google DeepMind发布Gemma 4的量化感知训练（QAT）模型，大幅降低内存消耗，手机端也能高效运行

美国Google DeepMind于6月5日（当地时间）发布了开源模型「Gemma 4」系列的“量化感知训练”（Quantization-Aware Training，简称QAT）检查点。该技术旨在大幅减少内存使用量，同时保持模型质量，适用于「E2B」「E4B」「12B」「26B MoE」「31B」等所有模型。自今年4月发布以来，Gemma 4不断扩展功能，包括引入加速推理的“多标记预测”（M

Google DeepMind宣布提供最高1000万美元的技术研究资助计划

Google DeepMind发布Gemma 4的量化感知训练（QAT）模型，大幅降低内存消耗，手机端也能高效运行