核心参数
| 参数 | 类型 | 默认值 | 描述 |
|---|---|---|---|
do_sample |
布尔值 | true |
是否采样以增加多样性 |
temperature |
浮点数 | 模型依赖 | 控制随机性,越高越随机 |
top_p |
浮点数 | 模型依赖 | 核采样控制多样性,与 temperature 二选一 |
max_tokens |
整数 | 模型依赖 | 单次生成最大 token 数 |
stream |
布尔值 | false |
是否流式返回 |
参数详解
1. do_sample — 采样开关
true(默认):随机采样,输出多样,适合创意、对话场景false:贪心策略,输出确定,适合精确、事实性场景
2. temperature — 温度(随机性控制)
- 低值(如 0.2):输出保守、确定,适合知识问答
- 高值(如 0.8):输出随机、多样,适合内容创作
3. top_p — 核采样
- 低值(如 0.2):采样范围小,生成的文本更确定
- 高值(如 0.9):采样范围大,生成的文本更多样
- 推荐值:0.8-0.95
注意:temperature 和 top_p 建议只用一个
4. max_tokens — 生成长度限制
- 建议设置 ≥ 1024
- 仅限制生成内容,不包含输入
- 达到限制时输出可能被截断
5. stream — 流式输出
true:逐字返回,适合实时交互false:一次性返回完整结果