Qwen3.5-35B-A3B-Baseを指示/推論モデルとして使えるって知っていましたか?

Reddit r/LocalLLaMA / 2026/4/17

💬 オピニオンTools & Practical UsageModels & Research

要点

  • 記事では、Qwen3.5-35B-A3B-Baseは単なるベースモデルではなく、指示(インストラクション)や推論用途にも使えると紹介しています。
  • 小さなDAN系のシステムプロンプトを使うことで、通常のインストラクトモデルよりも指示への追従や挙動の自由度が高まると勧めています。
  • その投稿では、このモデルは標準的なベースモデルにはないとされるチェーン・オブ・ソート(CoT)や、完全な指示追従に対応していると主張しています。
  • 「通常の」インストラクト版ほど賢くはない可能性はあるものの、Alibabaの学習内容とLoRAの活用により、ベースモデルでも実用的な微調整ができると述べています。
Qwen3.5-35B-A3B-Baseを命令/推論モデルとして使えることをご存じですか?

https://huggingface.co/mradermacher/Qwen3.5-35B-A3B-Base-GGUF

はい、Qwen 3.6が出ていて、とても良いモデルです。とはいえ、「検閲なしだけど公式」な、さらに一段上のモデルが欲しい人は、こちらを試してみてください。小さく賢いDAN-Syspromptを使うと、通常のインストラクトモデルほど神経質ではないので、かなりうまくいきます。

通常のベースモデルとは違って、命令の追従が完全にでき、さらにCoT(Chain of Thought)も可能です。"通常のもの"ほど賢いわけではありませんが、Alibabaはベースモデル上でLoRAを可能にするために、かなりの量のトークンで学習させています。

https://preview.redd.it/scrv2fuxepvg1.png?width=1291&format=png&auto=webp&s=e91382ee6441f0201d726476b6b32fa9f95ebbcd

投稿者 /u/PromptInjection_
[リンク] [コメント]