模型与定位
适合需要“回答 + 来源依据”的场景,如调研助手、行业情报与知识问答。核心优势是检索增强和引用输出。
参数速览
| 项目 | 说明 |
|---|---|
| 输入模态 | 文本为主 |
| 输出能力 | 文本回答、引用来源 |
| 推理模式 | 生成模型 + 检索增强 |
| 典型模型名 | 按控制台可用模型为准 |
| 上下文窗口 | 受模型与检索策略共同影响 |
常用请求参数
| 参数 | 作用 | 常见建议 |
|---|---|---|
model | 指定模型 | 根据延迟和质量分层,常用 sonar 系列 |
temperature | 控制发散度 | 调研问答建议低温 |
top_p | 核采样 | 与 temperature 配合微调 |
max_tokens | 最大输出长度 | 控制响应时长与成本 |
search_domain_filter | 检索域名过滤 | 企业知识场景建议白名单 |
return_citations | 返回引用 | 可信输出建议开启 |
stream | 流式输出 | 前端聊天体验更好 |
调用与兼容性
提供 REST API 与 SDK。建议将“检索是否开启、引用是否强制”纳入服务层策略,而非由前端直接控制。
版本与下线注意
检索策略和模型后端可能持续升级,建议对关键业务问题维护基准集,定期做一致性回归。
选型建议
如果业务强调“可追溯答案”,可优先选择带引用的回答路径;纯创作类任务可路由到通用模型以降低成本。