模型与定位
千问(Qwen)系列是阿里云通义千问提供的通用大语言模型,覆盖从轻量到超大规模的模型矩阵。支持文本生成、代码编写、数学推理、创意写作、多模态理解等多种能力。Qwen3 系列引入混合思考模式,支持思考与非思考模式切换。
参数速览
| 项目 | 说明 |
|---|---|
| 输入模态 | 文本、图像(多模态模型) |
| 输出能力 | 文本、结构化 JSON、工具调用、Function Calling |
| 推理模式 | 支持思考与非思考双模式(Qwen3 系列) |
| 典型模型名 | qwen-plus、qwen-max、qwen-coder-plus、qwen3-14b 等 |
| 上下文窗口 | 按模型不同 32K-128K 不等(以官方模型页为准) |
常用请求参数
| 参数 | 作用 | 常见建议 |
|---|---|---|
model | 指定模型 | 生产环境固定版本或使用别名 |
temperature | 控制随机性 | 事实任务 0.0-0.3,创作 0.5-0.9 |
top_p | 核采样 | 与 temperature 二选一优先调 |
max_tokens | 限制输出长度 | 避免超长响应造成成本波动 |
response_format | 结构化输出 | 需要稳定解析时使用 JSON |
tools | 工具定义 | Agent 场景显式声明可用工具 |
stream | 流式返回 | 聊天 UI 建议开启 |
调用与兼容性
支持 OpenAI 兼容接口和原生 DashScope 接口两种接入方式。注意区分区域端点:北京(dashscope.aliyuncs.com)和新加坡(dashscope-intl.aliyuncs.com),API Key 与区域绑定。
# OpenAI 兼容调��示例
curl https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer ${DASHSCOPE_API_KEY}" \
-d '{
"model": "qwen-plus",
"messages": [{"role": "user", "content": "你好,请介绍一下自己"}],
"stream": false
}'
版本与下线注意
模型持续迭代,建议定期检查阿里云百炼控制台获取最新模型列表和版本信息;生产环境建议锁定可回滚的模型版本。
选型建议
日常助手选 qwen-turbo(高速低延迟),高质量任务选 qwen-plus 或 qwen-max,代码任务选 qwen-coder-plus;需要复杂推理时选 Qwen3 系列思考模型。