v0.20.4

Ollama Releases / 4/9/2026

📰 NewsDeveloper Stack & InfrastructureSignals & Early Trends

Key Points

  • Ollamaのバージョンv0.20.4では、mlx側でNAXを活用しM5のパフォーマンス改善が行われました。
  • gemma4について、flash attentionの有効化が追加され、推論効率の向上を狙った変更が入っています。
  • 変更内容は主に2点の機能改善として整理されており、他の大規模アップデートはこの抜粋範囲では示されていません。
  • 完全な変更履歴はGitHubでv0.20.3からv0.20.4への差分(compareリンク)として確認できます。

What's Changed

  • mlx: Improve M5 performance with NAX
  • gemma4: enable flash attention

Full Changelog: v0.20.3...v0.20.4

v0.20.4 | AI Navigate