v0.20.1

Ollama Releases / 4/4/2026

📰 NewsDeveloper Stack & InfrastructureModels & Research

Key Points

  • v0.20.1(Ollama系の更新)では、bench機能にプロンプトキャリブレーション、コンテキストサイズ指定フラグ、NumCtxのレポート機能が追加されました。
  • model/parsersでは、Gemma4の引数パースにおいて引用符付き文字列内に"が含まれるケースの不具合を修正しました。
  • ggml層では、グラフ予約(reservation)の際にcublasGemmBatchedExをスキップする変更や、ROCmビルド時のcublasGemmBatchedEx reserveラッパーの修正が入っています。
  • Gemma4については、flash attentionの有効化により推論性能の改善を狙った更新が含まれています。

What's Changed

  • bench: add prompt calibration, context size flag, and NumCtx reporting by @dhiltgen in #15158
  • model/parsers: fix gemma4 arg parsing when quoted strings contain " by @drifkin in #15254
  • ggml: skip cublasGemmBatchedEx during graph reservation by @jessegross in #15301
  • gemma4: enable flash attention by @dhiltgen in #15296
  • ggml: fix ROCm build for cublasGemmBatchedEx reserve wrapper by @jessegross in #15305
  • model/parsers: rework gemma4 tool call handling by @drifkin in #15306

Full Changelog: v0.20.0...v0.20.1