去年年底,谷歌发布了Gemini 3 Pro,这标志着其大型语言模型技术的一大进步。如今,谷歌将支撑这些模型的技术和研究成果带给开源社区,推出了全新的Gemma 4系列开源权重模型。
谷歌此次提供了四个不同版本的Gemma 4模型,主要区别在于参数数量。针对边缘设备(如智能手机),有2亿和4亿参数的“Effective”模型;而针对更强大的计算设备,则有260亿参数的“Mixture of Experts”模型和310亿参数的“Dense”模型。参数数量通常决定了模型的表现能力,参数越多,模型的回答通常越准确,但对硬件要求也更高。
谷歌表示,Gemma 4在“每参数智能水平”上达到了前所未有的高度。为此,谷歌引用了Gemma 4中310亿和260亿参数版本在Arena AI文本排行榜上分别获得第三和第六名的成绩,甚至超过了体积是它们20倍的模型。
所有Gemma 4模型均支持视频和图像处理,适合光学字符识别等任务。较小的两个模型还支持音频输入和语音理解。此外,谷歌称Gemma 4系列能够离线生成代码,支持无网络环境下的编程体验。模型训练覆盖了140多种语言,具备广泛的语言适应能力。

谷歌以Apache 2.0开源许可证发布Gemma 4系列,区别于此前通过自有Gemma许可证发布的旧版本。这一变革赋予开发者更大的自由度,可以根据自身需求修改和部署模型。
谷歌表示:“这一开源许可证为开发者提供了完全的灵活性和数字主权,确保您对数据、基础设施和模型拥有完全控制权。无论是在本地还是云端环境,都能自由构建和安全部署。”
如果您想亲自体验这些模型,相关权重文件已在Hugging Face、Kaggle和Ollama平台上开放下载。


