Qwen 3.6 35B（A3B、Q4）対Qwen 3.6 27B（Q6）をM5 Pro 64GBで比較：速度とコード品質のベンチ

Reddit r/LocalLLaMA / 2026/4/26

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

共有:

要点

ユーザーがMacBook Pro M5 Pro 64GB上で、Qwen 3.6 35B A3B（4-bit）とQwen 3.6 27B Q6/UD（6-bit）を、LM Studio＋MLXランタイム、128Kコンテキスト条件で比較しました。
スピードのベンチでは、35B A3Bが約70〜72 tokens/sec（800〜1200トークンで約11〜16秒）だったのに対し、27Bは約9 tokens/sec（約32〜70秒）で、今回の条件では35Bが約8倍速い結果でした。
4つのコーディング課題（authフック、競合解決、アカウント削除処理、バグ特定）では、35B A3Bが総合9.8/10、27Bが8.75/10で、35Bが優位でした。
試した範囲では64GBのApple Silicon上でコーディング用途において、35B A3Bは小さなdenseモデルの27Bよりも品質と性能の両面で良い、というのが結論です。
結果はClaudeで作成・調整したテスト用プロンプトに基づき、筆者は専門家ではないため設定が最適でない可能性があり、改善の提案も求めています。

自分の m5 pro 64 で、2つのモデルのバージョンを試してみて、claude 上で結果をまとめました。専門家ではないので、設定/コンフィグが最適ではない可能性があります。試してみて、どんな結果や改善が可能かをぜひ共有してください。テスト用のプロンプトはテスト目的で claude に生成させました。

Qwen3.6 35B A3B vs 27B UD — M5 Pro 64GB ベンチマーク

ハードウェア: MacBook Pro M5 Pro 18コア · 64GB ユニファイドメモリ · LM Studio · MLX ランタイム · thinking OFF (/no_think) · 128K コンテキスト

仕様

	35B A3B MLX 4bit	27B UD MLX 6bit
モデルサイズ	~21.7GB	~30.5GB
アーキテクチャ	MoE — 3B active/token	Dense — 27B active/token
128K ctx 時のRAM	~27GB	~38GB

速度

テスト	35B A3B	27B UD
800トークンテスト	~72 tok/s · 11s	~9 tok/s · 32s
1200トークンテスト	~70 tok/s · 16s	~9 tok/s · 70s
優位性	8倍高速	ベースライン

知能 — 4タスクのコーディングベンチマーク

タスク	35B A3B	27B UD
Auth hook（useRequireAuth を使用）	9.5/10 — 型付き・マウント解除のクリーンアップ	8/10 — any を使用・クリーンアップなし
競合解決（500ms ルール）	10/10	10/10
アカウント削除（順序付きの操作）	10/10	10/10
バグの特定（syncBatch）	10/10 — バグ3件を発見 + 改善案	7/10 — バグ1件を発見
総合	9.8/10	8.75/10