跳转至

核心参数

参数 类型 默认值 描述
do_sample 布尔值 true 是否采样以增加多样性
temperature 浮点数 模型依赖 控制随机性,越高越随机
top_p 浮点数 模型依赖 核采样控制多样性,与 temperature 二选一
max_tokens 整数 模型依赖 单次生成最大 token 数
stream 布尔值 false 是否流式返回

参数详解

1. do_sample — 采样开关

  • true(默认):随机采样,输出多样,适合创意、对话场景
  • false:贪心策略,输出确定,适合精确、事实性场景

2. temperature — 温度(随机性控制)

  • 低值(如 0.2):输出保守、确定,适合知识问答
  • 高值(如 0.8):输出随机、多样,适合内容创作

3. top_p — 核采样

  • 低值(如 0.2):采样范围小,生成的文本更确定
  • 高值(如 0.9):采样范围大,生成的文本更多样
  • 推荐值:0.8-0.95

注意:temperature 和 top_p 建议只用一个

4. max_tokens — 生成长度限制

  • 建议设置 ≥ 1024
  • 仅限制生成内容,不包含输入
  • 达到限制时输出可能被截断

5. stream — 流式输出

  • true:逐字返回,适合实时交互
  • false:一次性返回完整结果