模型与定位
Gemma 是 Google 基于 Gemini 同源技术打造的开放权重模型系列,提供 2B~27B 多个规模,兼顾性能与部署效率。Gemma 3 系列支持多模态(图像+文本),上下文窗口提升至 128K。
参数速览
| 模型 | 参数量 | 上下文 | 开源权重 | 适用场景 |
|---|---|---|---|---|
| Gemma 3-1B | 1B | 32K | ✅ | 超低资源、移动端 |
| Gemma 3-4B | 4B | 128K | ✅ | 端侧推理、轻量服务 |
| Gemma 3-12B | 12B | 128K | ✅ | 通用对话、代码辅助 |
| Gemma 3-27B | 27B | 128K | ✅ | 复杂推理、Agent |
| Gemma 2-9B | 9B | 8K | ✅ | 稳定生产部署 |
平台接入
| 平台 | 说明 |
|---|---|
| Google AI Studio | 官方 API 服务 |
| HuggingFace | 模型权重下载 |
| Kaggle | 免费推理环境 |
选型建议
本地/端侧部署首选 Gemma 3-4B;需要多模态选 Gemma 3 全系列;追求稳定生产环境选 Gemma 2-9B。