Qwen3.5 の最適パラメータ集

Reddit r/LocalLLaMA / 2026/3/20

💬 オピニオンTools & Practical UsageModels & Research

原文を読む →

共有:

要点

Reddit の議論は、Qwen3.5 の安定したパラメータを探しており、量子化設定、推論エンジン、実用的な設定を含む。
この投稿は、Unsloth の推奨に基づく Qwen3.5-35B (A3B) の具体的なパラメータセットを共有しており、温度、top-p、top-k、min-p、存在ペナルティ、リピートペナルティ、およびカスタムメッセージを含む推論予算を含む。
使用用途は非コーディング、一般的なチャット、量子化設定へのリンク、推論エンジン llama.cpp v8400 を挙げている。
著者は、モデルがまだ考えすぎる傾向があり、重い推論を要するタスクでない限りは使用をためらうと報告している。
このスレッドは、より良いパラメータ設定を提案するように他の人を招待しており、元の議論リンクを参照している。

Qwen3.5 は数週間前から公開されています。ほこりが落ち着き、安定した量子化モデル、推論エンジン、パラメータが揃っていることを願っています。

現在使用しているパラメータを、どの用途で、どれくらいうまく機能しているかを共有してください（量子化と推論エンジンを含めて）。これが最適な設定を見つける最良の方法のようです。

以下は私の設定です - Unsloth の推奨に基づきここおよびこのサブの前のスレッド

For A3B-35B:

 --temp 0.7 --top-p 0.8 --top-k 20 --min-p 0.00 --presence-penalty 1.5 --repeat-penalty 1.0 --reasoning-budget 1000 --reasoning-budget-message "... reasoning budget exceeded, need to answer.
"

用途: 非コーディング、一般的なチャット。
量子化ファイル: https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF?show_file_info=Qwen3.5-35B-A3B-Q4_K_M.gguf
推論エンジン: llama.cpp v8400

パフォーマンス: まだ考えすぎる傾向があり、特に多くの思考を要するタスクを明確に指定しない限り、使うのを避けてしまう自分に気づきます。

この問題を解決するための、より良いパラメータ設定を誰かが持っていることを願っていますか？

投稿者 /u/rm-rf-rm
[リンク] [コメント]

コンテンツクリエイターのためのAIプロンプト完全ガイド

Dev.to

追跡業務の自動化：フェスティバル出店者のコンプライアンスのためのAI

Dev.to

山積みからプロトコルへ：スケール時のベンダーコンプライアンスにおけるAI活用

Dev.to

MCPスキルとMCPツール: サーバーを正しく構成する方法

Dev.to

テックキャリアに4年間も費やしている

Dev.to

Qwen3.5 の最適パラメータ集

要点

関連記事

コンテンツクリエイターのためのAIプロンプト完全ガイド

追跡業務の自動化：フェスティバル出店者のコンプライアンスのためのAI

山積みからプロトコルへ：スケール時のベンダーコンプライアンスにおけるAI活用

MCPスキルとMCPツール: サーバーを正しく構成する方法

テックキャリアに4年間も費やしている

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer