v0.23.1

Ollama Releases / 2026/5/6

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • Gemma 4のMTP(Multi-token Processing)による推論で、Mac上でのspeculative decodingがサポートされました。
  • Gemma 4 31Bモデルのコーディングタスクにおいて、従来より2倍以上の速度向上が見込めるとされています。
  • MLXおよびMLX-Cのスレッディング修正が取り込まれ、MLX runnerの動作安定性/性能に改善が入っています。
  • Ollama v0.23.1ではGoのバージョンが1.26に更新されています。
  • Gemma 4のMTP speculative decodingは、公式の変更リスト(#15980)として追加されています。

MLX runner 向け Gemma 4 MTP(Multi-token Processing)

Gemma 4 の MTP(speculative decoding)が Mac でサポートされるようになりました。これにより、コーディングタスクにおいて Gemma 4 31B モデルで 2 倍以上の速度向上が見込めます。

ollama run gemma4:31b-coding-mtp-bf16

変更点

完全な変更履歴: v0.23.0...v0.23.1-rc0