MLX runner 向け Gemma 4 MTP(Multi-token Processing)
Gemma 4 の MTP(speculative decoding)が Mac でサポートされるようになりました。これにより、コーディングタスクにおいて Gemma 4 31B モデルで 2 倍以上の速度向上が見込めます。
ollama run gemma4:31b-coding-mtp-bf16
変更点
- @dhiltgen が #15845 で、スレッド関連の修正により MLX と MLX-C を更新
- go: @ParthSareen が #15904 で 1.26 に更新
- @pdevine が #15980 で Gemma 4 MTP の speculative decoding を追加
完全な変更履歴: v0.23.0...v0.23.1-rc0




