こちらは Huggingfaceのページ から引用しています:
生成に使用する以下の一連のサンプリングパラメータを推奨します
一般的なタスク向けの思考モード: temperature=1.0, top_p=0.95, top_k=20, min_p=0.0, presence_penalty=0.0, repetition_penalty=1.0 正確なコーディングタスク向けの思考モード(例:WebDev): temperature=0.6, top_p=0.95, top_k=20, min_p=0.0, presence_penalty=0.0, repetition_penalty=1.0 指示(または思考なし)モード: temperature=0.7, top_p=0.80, top_k=20, min_p=0.0, presence_penalty=1.5, repetition_penalty=1.0 これらは3.5とは異なるので、注意を向けてもらいたく思いました。
[リンク] [コメント]




