27B Denseに2.4倍差をつけたMoE — 8GB VRAMで測った35B-A3Bの実力

Zenn / 4/7/2026

💬 OpinionIdeas & Deep AnalysisTools & Practical UsageModels & Research

Key Points

  • 8GB VRAM環境で、35B-A3Bの実力を“27B Dense”に対する相対性能として評価した結果が示されている。
  • MoE(Mixture of Experts)によって、同等クラスのモデルよりも“2.4倍差”に相当する性能差が観測されたという主張が中心になっている。
  • Dense(通常の密なモデル)と比較し、同じような実使用制約(VRAM)でもMoEが効率的に性能を引き上げ得る可能性が示唆される。
  • 具体的な数値ベンチや条件(A3B、8GB VRAMでの測定)を通じて、モデル選定・導入判断に使える知見として整理されている。
MoE(Mixture of Experts)は「VRAMが潤沢な環境向け」とされることが多い。35Bのパラメータ全体をVRAMに載せてこそ速い、8GBでは恩恵がない——自分もそう思っていた。 RTX 4060 8GBでQwen3.5の3モデルを実測したら、その前提が崩れた。 実測から始める 前回の記事でQwen3.5の9B、27B、35B-A3Bを同一環境で比較した。その中からMoEに関わるデータを抜粋する。 検証環境: RTX 4060 8GB / Ryzen 7 / 32GB DDR5 / llama.cpp / Q4_K_M モデル 速度(t/s...

Continue reading this article on the original site.

Read original →