広告

両親の両方を超えた子——Model MRI手法による Darwin-35B-A3B-Opus(35B/3B MoE)

Reddit r/LocalLLaMA / 2026/4/1

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • Darwin-35B-A3B-Opus は、SeaWolf-AI/VIDRAFT_LAB が自社の Darwin V5 モデル・マージ・エンジンで作成した 35B の Mixture-of-Experts(MoE)モデル(アクティブなパラメータは約 3B のみ)である。
  • チームは、レイヤーごとに「Model MRI/CTスキャン」手法を用いて、2つの親モデルのどの構成要素が推論性能に最も効果的に寄与するかを特定した。
  • マージ戦略では、(特に L34〜L38 の)蒸留 Claude 4.6 Opus の推論レイヤーを選択的に移植しつつ、Qwen3.5-35B-A3B の「健全なエキスパート」と差し替え、出力は父モデルのルータが駆動する。
  • 報告されたベンチマークの改善として、GPQA Diamond が 90.0%(父 84.2%/母 85.0%)まで上昇している。MMMLU は概ね父と同程度(約 85%)であり、多モーダルおよび多言語性能は大きく維持されている。
  • 本モデルは高速であるとされており(H100 で約 148 tok/s、Q4 で単一の RTX 4090 上で動作)、Apache 2.0 のもとで完全にオープンである。著者らは近日中に Darwin V5 の完全なアルゴリズムと論文を公開する予定だ。

Darwin-35B-A3B-Opus は SeaWolf-AI / VIDRAFT_LAB が新しい Darwin V5 統合エンジンを使って作成した 35B MoE モデル(有効なのは 3B パラメータのみ)です。

彼らは、何が実際に機能しているのかを突き止めるために、親モデルを層ごとに深く "CTスキャン"(モデル MRI)するシステムを構築しました。

父:Qwen3.5-35B-A3B(強力なゼネラリスト)

母:Claude 4.6 Opus を蒸留(推論は強いが、蒸留後に大量の「dead experts(死んだ専門家)」があったようです)

マージ戦略:母の強い推論レイヤー(特に L34〜L38)を移植し、父の健康な専門家を入れ替えて、父のルーターに出力を処理させます。

報告された結果:

GPQA Diamond:90.0%

→ 父:84.2%

→ 母:85.0%

→ これは、主要なトレードオフなしで +5.8〜5.9% のしっかりした伸びです

MMMLU:85.0%(ほぼ父と同じで 85.2%)

マルチモーダル(画像 + 映像)と 201 言語を完全に保持

262K のネイティブ文脈長

目を見張る速さ:H100 で約 148 tok/s、Q4 なら RTX 4090 1 台で動作

ライセンス:Apache 2.0 — 完全にオープン。

彼らはこれを「両親のどちらも超えた子」と呼んでおり、完全な Darwin V5 のアルゴリズムと論文を近いうちに公開する予定です。

モデルページ: https://huggingface.co/FINAL-Bench/Darwin-35B-A3B-Opus

submitted by /u/Own-Potential-2308
[link] [comments]

広告