27B Denseに2.4倍差をつけたMoE — 8GB VRAMで測った35B-A3Bの実力
Zenn / 4/7/2026
💬 OpinionIdeas & Deep AnalysisTools & Practical UsageModels & Research
Key Points
- 8GB VRAM環境で、35B-A3Bの実力を“27B Dense”に対する相対性能として評価した結果が示されている。
- MoE(Mixture of Experts)によって、同等クラスのモデルよりも“2.4倍差”に相当する性能差が観測されたという主張が中心になっている。
- Dense(通常の密なモデル)と比較し、同じような実使用制約(VRAM)でもMoEが効率的に性能を引き上げ得る可能性が示唆される。
- 具体的な数値ベンチや条件(A3B、8GB VRAMでの測定)を通じて、モデル選定・導入判断に使える知見として整理されている。
MoE(Mixture of Experts)は「VRAMが潤沢な環境向け」とされることが多い。35Bのパラメータ全体をVRAMに載せてこそ速い、8GBでは恩恵がない——自分もそう思っていた。
RTX 4060 8GBでQwen3.5の3モデルを実測したら、その前提が崩れた。
実測から始める
前回の記事でQwen3.5の9B、27B、35B-A3Bを同一環境で比較した。その中からMoEに関わるデータを抜粋する。
検証環境: RTX 4060 8GB / Ryzen 7 / 32GB DDR5 / llama.cpp / Q4_K_M
モデル 速度(t/s...
Continue reading this article on the original site.
Read original →



