v0.20.4

Ollama Releases / 4/8/2026

📰 NewsTools & Practical UsageModels & Research

Key Points

  • v0.20.4-rc1では、mlx側の最適化によりM5性能をNAXで改善する変更が入っています。
  • gemma4について、flash attentionの有効化により推論の効率・速度向上が図られています。
  • create関連の実験的パスを整理し、safetensorモデルからの作成で既存モデルを扱う際の不具合を修正しています。
  • gemma4の不足ファイル追加により、モデル配布/利用時の欠損問題を解消する対応が含まれています。

What's Changed

Full Changelog: v0.20.3...v0.20.4-rc1