模型与定位
Gemini 强调多模态与长上下文能力,适用于复杂资料分析、图文问答、自动化任务与开发助手。
参数速览
| 项目 | 说明 |
|---|---|
| 输入模态 | 文本、图像、音频、视频(按模型能力) |
| 输出能力 | 文本、结构化内容、工具调用 |
| 推理模式 | 提供面向质量与速度的不同层级 |
| 典型模型名 | gemini-3.1-pro、gemini-3.1-flash、gemini-3.1-flash-lite(以官方列表为准) |
| 上下文窗口 | 支持超长上下文能力,具体上限按模型版本 |
常用请求参数
| 参数 | 作用 | 常见建议 |
|---|---|---|
model | 指定模型版本 | 质量优先选 Pro,成本优先选 Flash |
temperature | 控制输出发散度 | 严谨问答建议低温 |
top_p / top_k | 控制采样范围 | 对稳定性敏感时降低采样范围 |
max_output_tokens | 限制输出长度 | 长文生成需明确上限 |
response_mime_type | 约束返回格式 | 结构化场景可指定 JSON |
tools | 声明工具能力 | 搜索或函数调用时显式开启 |
safety_settings | 安全阈值控制 | 企业场景建议统一策略 |
调用与兼容性
可通过 Gemini API 与 Google Cloud 生态接入,适合与检索、存储、工作流系统联动。
版本与下线注意
部分预览模型可能调整较快,生产环境建议优先使用稳定版并设置灰度切换。
选型建议
多模态和长文档理解优先 Gemini;对响应速度敏感的聊天与工具编排优先 Flash 系列。