変更点
- mlxrunner: @jessegross による #15736 で、複数のシーケンスにわたってサンプラーをバッチ処理
- tokenizer: @dhiltgen による #15844 で、マルチ正規表現のBPEオフセット処理を修正
- mlx: @dhiltgen による #15566 で、NVIDIA TensorRT Model Optimizer のインポートに対応
- app/server: デスクトップアプリの起動がアクティブな
ollama launchセッションを終了させてしまう問題を @hoyyeva による #15657 で修正 - バッチ処理のためのモデル対応。@jessegross による #15814
- @dhiltgen による新しいモデル。#15861
完全な変更履歴: v0.21.3-rc0...v0.22.1-rc0


