Qwen3.5 は数週間前から公開されています。ほこりが落ち着き、安定した量子化モデル、推論エンジン、パラメータが揃っていることを願っています。
現在使用しているパラメータを、どの用途で、どれくらいうまく機能しているかを共有してください(量子化と推論エンジンを含めて)。これが最適な設定を見つける最良の方法のようです。
以下は私の設定です - Unsloth の推奨に基づき ここ およびこのサブの前のスレッド
For A3B-35B:
--temp 0.7 --top-p 0.8 --top-k 20 --min-p 0.00 --presence-penalty 1.5 --repeat-penalty 1.0 --reasoning-budget 1000 --reasoning-budget-message "... reasoning budget exceeded, need to answer.
" - 用途: 非コーディング、一般的なチャット。
- 量子化ファイル: https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF?show_file_info=Qwen3.5-35B-A3B-Q4_K_M.gguf
- 推論エンジン: llama.cpp v8400
パフォーマンス: まだ考えすぎる傾向があり、特に多くの思考を要するタスクを明確に指定しない限り、使うのを避けてしまう自分に気づきます。
この問題を解決するための、より良いパラメータ設定を誰かが持っていることを願っていますか?
[リンク] [コメント]