← 返回AI精选
大语言模型

Gemini

Gemini 是 Google 的多模态模型家族,覆盖轻量到高性能场景,适合搜索增强、代码、视觉理解与长上下文任务。

模型与定位

Gemini 强调多模态与长上下文能力,适用于复杂资料分析、图文问答、自动化任务与开发助手。

参数速览

项目说明
输入模态文本、图像、音频、视频(按模型能力)
输出能力文本、结构化内容、工具调用
推理模式提供面向质量与速度的不同层级
典型模型名gemini-3.1-progemini-3.1-flashgemini-3.1-flash-lite(以官方列表为准)
上下文窗口支持超长上下文能力,具体上限按模型版本

常用请求参数

参数作用常见建议
model指定模型版本质量优先选 Pro,成本优先选 Flash
temperature控制输出发散度严谨问答建议低温
top_p / top_k控制采样范围对稳定性敏感时降低采样范围
max_output_tokens限制输出长度长文生成需明确上限
response_mime_type约束返回格式结构化场景可指定 JSON
tools声明工具能力搜索或函数调用时显式开启
safety_settings安全阈值控制企业场景建议统一策略

调用与兼容性

可通过 Gemini API 与 Google Cloud 生态接入,适合与检索、存储、工作流系统联动。

版本与下线注意

部分预览模型可能调整较快,生产环境建议优先使用稳定版并设置灰度切换。

选型建议

多模态和长文档理解优先 Gemini;对响应速度敏感的聊天与工具编排优先 Flash 系列。