広告

ONEにすべてのDistill(Claude、Gemini、OpenAI、Deepseek、Kimi...): Savant Commander 48B - 4×12B MOE.

Reddit r/LocalLLaMA / 2026/3/24

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • Savant Commander 48B は、手動でルーティングを実装したカスタム Qwen MoE(4×12B)で、Qwen 3 の 256K コンテキストウィンドウ上で動作する 12 個の「トップ・ディスティル」(例: Claude、Gemini、OpenAI、Deepseek、Kimi)を含みます。
  • ルーティングのロジックにより各ディスティルは互いから分離されつつも、それらの間で接続できるようになっており、ユーザーはプロンプト制御によって有効化するディスティル(またはディスティル群)を選択できます。
  • 本プロジェクトでは、同じプロンプトを用いて異なるディスティルの挙動を並行評価でき、1つのMoEシステム内でモデルバリアント間の違いを浮き彫りにします。
  • リリースでは「REG/UNCENSORED」の GGUF アーティファクトが提供され、ゲートされた構成と「異端/heretic/uncensored」構成それぞれの別リポジトリリンクも用意されています。また、MoE全体を異端化するよりも、ゲート後に各ディスティルを個別に無修正化する方が望ましいという注記があります。
  • 「指揮統制(command and control)」の振る舞いと利用手順はリポジトリカードに文書化されており、本モデルは単一の固定モデルではなく、制御可能なマルチディスティルのローカル推論環境として位置づけられています。

Qwen 3(256Kコンテキスト)上に、手動でルーティングを組み込んだカスタムQWEN moe。12のトップ蒸留(Claude、Gemini、OpenAI、Deepseekなどなど)で構成。

このカスタムルーティングは、それぞれの蒸留を互いに隔離するだけでなく、同時にそれら同士の接続も可能にしています。

プロンプト制御のもとで、作動させたい/使いたい蒸留(複数)を選択できます。

同じプロンプト(複数)を使って、異なる蒸留同士の違いをテストして確認できます。

リポジトリカードに記載されているコマンド&コントロール機能。(詳細な手順)

Heretic(非検閲版)-> 各モデルは、MOE全体をHERETIC化するのではなく、まずそれぞれをHERETIC化してからMOE構造に追加しています(ネガティブな結果)。

REG / UNCENSORED - GGUF:

https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill-GGUF

https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored-GGUF

SOURCE:

https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-GATED-12x-Closed-Open-Source-Distill

https://huggingface.co/DavidAU/Qwen3-48B-A4B-Savant-Commander-Distill-12X-Closed-Open-Heretic-Uncensored

submitted by /u/Dangerous_Fix_5526
[link] [comments]

広告