Note the new recommended sampling parameters for Qwen3.6 27B

Reddit r/LocalLLaMA / 4/23/2026

📰 NewsTools & Practical UsageModels & Research

Key Points

  • Qwen3.6-27Bの生成に推奨されるサンプリングパラメータ一式が、Hugging Face上で提示されたと紹介されています。
  • タスク種別ごとに「Thinking mode(一般タスク)」「Thinking mode(精密なコーディング例:WebDev)」「Instruct/非Thinkingモード」の3パターンで温度やtop_p、presence_penaltyなどが調整されています。
  • 一般タスクのThinking modeではtemperature=1.0・top_p=0.95・top_k=20、精密コーディング向けではtemperature=0.6・top_p=0.95・top_k=20が推奨されています。
  • Instruct(非Thinking)モードではtemperature=0.7・top_p=0.80に加えpresence_penalty=1.5が指定され、Qwen3.5の推奨設定とは異なる点が注意喚起されています。

Taken from their Huggingface Page:

We recommend using the following set of sampling parameters for generation

Thinking mode for general tasks: temperature=1.0, top_p=0.95, top_k=20, min_p=0.0, presence_penalty=0.0, repetition_penalty=1.0 Thinking mode for precise coding tasks (e.g. WebDev): temperature=0.6, top_p=0.95, top_k=20, min_p=0.0, presence_penalty=0.0, repetition_penalty=1.0 Instruct (or non-thinking) mode: temperature=0.7, top_p=0.80, top_k=20, min_p=0.0, presence_penalty=1.5, repetition_penalty=1.0 

These are different from 3.5 so I thought I would draw your attention to them.

submitted by /u/Thrumpwart
[link] [comments]