v0.23.1

Ollama Releases / 5/6/2026

📰 NewsDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

Key Points

  • Gemma 4のMTP(Multi-token Processing)による推論で、Mac上でのspeculative decodingがサポートされました。
  • Gemma 4 31Bモデルのコーディングタスクにおいて、従来より2倍以上の速度向上が見込めるとされています。
  • MLXおよびMLX-Cのスレッディング修正が取り込まれ、MLX runnerの動作安定性/性能に改善が入っています。
  • Ollama v0.23.1ではGoのバージョンが1.26に更新されています。
  • Gemma 4のMTP speculative decodingは、公式の変更リスト(#15980)として追加されています。

Gemma 4 MTP (Multi-token Processing) for the MLX runner

Gemma 4 MTP speculative decoding is now supported on Macs. This can give over a 2x speed increase for the Gemma 4 31B model on coding tasks.

ollama run gemma4:31b-coding-mtp-bf16

What's Changed

Full Changelog: v0.23.0...v0.23.1-rc0