v0.20.4

Ollama Releases / 2026/4/8

📰 ニュースTools & Practical UsageModels & Research

要点

  • v0.20.4-rc1では、mlx側の最適化によりM5性能をNAXで改善する変更が入っています。
  • gemma4について、flash attentionの有効化により推論の効率・速度向上が図られています。
  • create関連の実験的パスを整理し、safetensorモデルからの作成で既存モデルを扱う際の不具合を修正しています。
  • gemma4の不足ファイル追加により、モデル配布/利用時の欠損問題を解消する対応が含まれています。

変更点

  • mlx: @dhiltgen による #15345 での NAX による M5 のパフォーマンス改善
  • gemma4: @dhiltgen による #15378 での flash attention の有効化
  • create: @dhiltgen による #14679 での 実験的なパスの整理、既存の safetensor モデルからの create の修正
  • gemma4: @dhiltgen による #15394 での 失われていたファイルの追加

完全な変更履歴: v0.20.3...v0.20.4-rc1