跳转至

文档中心

核心参数

核心参数

参数	类型	默认值	描述
`do_sample`	布尔值	`true`	是否采样以增加多样性
`temperature`	浮点数	模型依赖	控制随机性，越高越随机
`top_p`	浮点数	模型依赖	核采样控制多样性，与 temperature 二选一
`max_tokens`	整数	模型依赖	单次生成最大 token 数
`stream`	布尔值	`false`	是否流式返回

参数详解

1. do_sample — 采样开关

true（默认）：随机采样，输出多样，适合创意、对话场景
false：贪心策略，输出确定，适合精确、事实性场景

2. temperature — 温度（随机性控制）

低值（如 0.2）：输出保守、确定，适合知识问答
高值（如 0.8）：输出随机、多样，适合内容创作

3. top_p — 核采样

低值（如 0.2）：采样范围小，生成的文本更确定
高值（如 0.9）：采样范围大，生成的文本更多样
推荐值：0.8-0.95

注意：temperature 和 top_p 建议只用一个

4. max_tokens — 生成长度限制

建议设置 ≥ 1024
仅限制生成内容，不包含输入
达到限制时输出可能被截断

5. stream — 流式输出

true：逐字返回，适合实时交互
false：一次性返回完整结果