自分の m5 pro 64 で、2つのモデルのバージョンを試してみて、claude 上で結果をまとめました。専門家ではないので、設定/コンフィグが最適ではない可能性があります。試してみて、どんな結果や改善が可能かをぜひ共有してください。テスト用のプロンプトはテスト目的で claude に生成させました。
Qwen3.6 35B A3B vs 27B UD — M5 Pro 64GB ベンチマーク
ハードウェア: MacBook Pro M5 Pro 18コア · 64GB ユニファイドメモリ · LM Studio · MLX ランタイム · thinking OFF (/no_think) · 128K コンテキスト
仕様
| 35B A3B MLX 4bit | 27B UD MLX 6bit | |
|---|---|---|
| モデルサイズ | ~21.7GB | ~30.5GB |
| アーキテクチャ | MoE — 3B active/token | Dense — 27B active/token |
| 128K ctx 時のRAM | ~27GB | ~38GB |
速度
| テスト | 35B A3B | 27B UD |
|---|---|---|
| 800トークンテスト | ~72 tok/s · 11s | ~9 tok/s · 32s |
| 1200トークンテスト | ~70 tok/s · 16s | ~9 tok/s · 70s |
| 優位性 | 8倍高速 | ベースライン |
知能 — 4タスクのコーディングベンチマーク
| タスク | 35B A3B | 27B UD |
|---|---|---|
| Auth hook(useRequireAuth を使用) | 9.5/10 — 型付き・マウント解除のクリーンアップ | 8/10 — any を使用・クリーンアップなし |
| 競合解決(500ms ルール) | 10/10 | 10/10 |
| アカウント削除(順序付きの操作) | 10/10 | 10/10 |
| バグの特定(syncBatch) | 10/10 — バグ3件を発見 + 改善案 | 7/10 — バグ1件を発見 |
| 総合 | 9.8/10 | 8.75/10 |
テストプロンプト: 4つのコーディングタスク · max_tokens 1200 · temp 0.6 · /no_think システムプロンプト
結論: 64GB の Apple Silicon 上でのコーディングタスクでは、35B A3B が速度と品質の両方で勝ちました。27B は遅く(8倍)これらのタスクにおいて、Dense モデルに期待される推論の深さの優位性を示しませんでした。
mac をどれにするか探していたときに、いくらかの数値/参考情報が欲しかったので、誰かの役に立てばと思います。
[link] [comments]




