v0.20.1

Ollama Releases / 2026/4/4

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • v0.20.1(Ollama系の更新)では、bench機能にプロンプトキャリブレーション、コンテキストサイズ指定フラグ、NumCtxのレポート機能が追加されました。
  • model/parsersでは、Gemma4の引数パースにおいて引用符付き文字列内に"が含まれるケースの不具合を修正しました。
  • ggml層では、グラフ予約(reservation)の際にcublasGemmBatchedExをスキップする変更や、ROCmビルド時のcublasGemmBatchedEx reserveラッパーの修正が入っています。
  • Gemma4については、flash attentionの有効化により推論性能の改善を狙った更新が含まれています。

変更点

  • bench: プロンプトのキャリブレーション、コンテキストサイズのフラグ、およびNumCtxのレポートを追加 - @dhiltgen によって #15158
  • model/parsers: クォートされた文字列に " が含まれている場合の gemma4 の引数パースを修正 - @drifkin によって #15254
  • ggml: グラフ予約中に cublasGemmBatchedEx をスキップ - @jessegross によって #15301
  • gemma4: フラッシュ・アテンションを有効化 - @dhiltgen によって #15296
  • ggml: cublasGemmBatchedEx の予約ラッパーに対する ROCm ビルドを修正 - @jessegross によって #15305
  • model/parsers: gemma4 のツール呼び出しハンドリングを作り直し - @drifkin によって #15306

完全な変更履歴: v0.20.0...v0.20.1