Qwen 3.6 35B(A3B、Q4)対Qwen 3.6 27B(Q6)をM5 Pro 64GBで比較:速度とコード品質のベンチ

Reddit r/LocalLLaMA / 2026/4/26

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • ユーザーがMacBook Pro M5 Pro 64GB上で、Qwen 3.6 35B A3B(4-bit)とQwen 3.6 27B Q6/UD(6-bit)を、LM Studio+MLXランタイム、128Kコンテキスト条件で比較しました。
  • スピードのベンチでは、35B A3Bが約70〜72 tokens/sec(800〜1200トークンで約11〜16秒)だったのに対し、27Bは約9 tokens/sec(約32〜70秒)で、今回の条件では35Bが約8倍速い結果でした。
  • 4つのコーディング課題(authフック、競合解決、アカウント削除処理、バグ特定)では、35B A3Bが総合9.8/10、27Bが8.75/10で、35Bが優位でした。
  • 試した範囲では64GBのApple Silicon上でコーディング用途において、35B A3Bは小さなdenseモデルの27Bよりも品質と性能の両面で良い、というのが結論です。
  • 結果はClaudeで作成・調整したテスト用プロンプトに基づき、筆者は専門家ではないため設定が最適でない可能性があり、改善の提案も求めています。

自分の m5 pro 64 で、2つのモデルのバージョンを試してみて、claude 上で結果をまとめました。専門家ではないので、設定/コンフィグが最適ではない可能性があります。試してみて、どんな結果や改善が可能かをぜひ共有してください。テスト用のプロンプトはテスト目的で claude に生成させました。

Qwen3.6 35B A3B vs 27B UD — M5 Pro 64GB ベンチマーク

ハードウェア: MacBook Pro M5 Pro 18コア · 64GB ユニファイドメモリ · LM Studio · MLX ランタイム · thinking OFF (/no_think) · 128K コンテキスト

仕様

35B A3B MLX 4bit 27B UD MLX 6bit
モデルサイズ ~21.7GB ~30.5GB
アーキテクチャ MoE — 3B active/token Dense — 27B active/token
128K ctx 時のRAM ~27GB ~38GB

速度

テスト 35B A3B 27B UD
800トークンテスト ~72 tok/s · 11s ~9 tok/s · 32s
1200トークンテスト ~70 tok/s · 16s ~9 tok/s · 70s
優位性 8倍高速 ベースライン

知能 — 4タスクのコーディングベンチマーク

タスク 35B A3B 27B UD
Auth hook(useRequireAuth を使用) 9.5/10 — 型付き・マウント解除のクリーンアップ 8/10 — any を使用・クリーンアップなし
競合解決(500ms ルール) 10/10 10/10
アカウント削除(順序付きの操作) 10/10 10/10
バグの特定(syncBatch) 10/10 — バグ3件を発見 + 改善案 7/10 — バグ1件を発見
総合 9.8/10 8.75/10

テストプロンプト: 4つのコーディングタスク · max_tokens 1200 · temp 0.6 · /no_think システムプロンプト

結論: 64GB の Apple Silicon 上でのコーディングタスクでは、35B A3B が速度と品質の両方で勝ちました。27B は遅く(8倍)これらのタスクにおいて、Dense モデルに期待される推論の深さの優位性を示しませんでした。

mac をどれにするか探していたときに、いくらかの数値/参考情報が欲しかったので、誰かの役に立てばと思います。

提出者 /u/skyyyy007
[link] [comments]