v0.22.1

Ollama Releases / 2026/4/29

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • v0.22.1では、mlxrunnerの改良により、複数シーケンスにまたがってサンプラーをバッチ処理し、生成時の効率を高めています。
  • トークナイザーは、マルチ正規表現BPEのオフセット処理を正しくする修正が入り、トークン化の挙動の正確性が向上しています。
  • mlx側では、NVIDIA TensorRT Model Optimizerのインポートに対応し、最適化やデプロイの選択肢が広がりました。
  • デスクトップアプリ/サーバーの起動処理を修正し、進行中の`ollama launch`セッションを終了させてしまう問題を防ぎます。
  • モデル実行のスループット向上のため、バッチ処理に関する追加対応も入っています。

変更点

  • mlxrunner: @jessegross による #15736 で、複数のシーケンスにわたってサンプラーをバッチ処理
  • tokenizer: @dhiltgen による #15844 で、マルチ正規表現のBPEオフセット処理を修正
  • mlx: @dhiltgen による #15566 で、NVIDIA TensorRT Model Optimizer のインポートに対応
  • app/server: デスクトップアプリの起動がアクティブな ollama launch セッションを終了させてしまう問題を @hoyyeva による #15657 で修正
  • バッチ処理のためのモデル対応。@jessegross による #15814
  • @dhiltgen による新しいモデル。#15861

完全な変更履歴: v0.21.3-rc0...v0.22.1-rc0