Darwin-35B-A3B-Opus は SeaWolf-AI / VIDRAFT_LAB が新しい Darwin V5 統合エンジンを使って作成した 35B MoE モデル(有効なのは 3B パラメータのみ)です。
彼らは、何が実際に機能しているのかを突き止めるために、親モデルを層ごとに深く "CTスキャン"(モデル MRI)するシステムを構築しました。
父:Qwen3.5-35B-A3B(強力なゼネラリスト)
母:Claude 4.6 Opus を蒸留(推論は強いが、蒸留後に大量の「dead experts(死んだ専門家)」があったようです)
マージ戦略:母の強い推論レイヤー(特に L34〜L38)を移植し、父の健康な専門家を入れ替えて、父のルーターに出力を処理させます。
報告された結果:
GPQA Diamond:90.0%
→ 父:84.2%
→ 母:85.0%
→ これは、主要なトレードオフなしで +5.8〜5.9% のしっかりした伸びです
MMMLU:85.0%(ほぼ父と同じで 85.2%)
マルチモーダル(画像 + 映像)と 201 言語を完全に保持
262K のネイティブ文脈長
目を見張る速さ:H100 で約 148 tok/s、Q4 なら RTX 4090 1 台で動作
ライセンス:Apache 2.0 — 完全にオープン。
彼らはこれを「両親のどちらも超えた子」と呼んでおり、完全な Darwin V5 のアルゴリズムと論文を近いうちに公開する予定です。
モデルページ: https://huggingface.co/FINAL-Bench/Darwin-35B-A3B-Opus
[link] [comments]




