| かなり速い!ピーク時で約114ワット、応答がだいたいかなり速いので短いバーストになります。 [リンク] [コメント] |
Gemma 4 26b a4b - MacBook Pro M5 MAX。約81 tok/secで平均化
Reddit r/LocalLLaMA / 2026/4/3
💬 オピニオンSignals & Early TrendsTools & Practical UsageModels & Research
要点
- Redditの投稿によると、ローカル推論環境(MacBook Pro M5 Max)でGemma 4 26Bを動作させた際に、応答速度が約81 tok/sec程度とかなり高速に見える。
- ピーク時の消費電力は約114Wで、応答が短時間で返るため電力は「短いバースト」的に上がる傾向があると報告されている。
- 本内容は新モデルの正式リリースではなく、特定ハード上での推論性能・電力挙動に関する実測ベースの“運用感”を共有するもの。
- ローカルLLMを用いる際の期待値(速度と電力のトレードオフ)を掴むための早期トレンド/シグナルとして位置づけられる。




