変更点
- mlxrunner: @jessegross が #15736 で、複数のシーケンスにまたがってサンプラーをバッチ処理
- tokenizer: @dhiltgen が #15844 で、マルチ正規表現 BPE のオフセット処理を修正
- mlx: @dhiltgen が #15566 で、NVIDIA TensorRT Model Optimizer のインポートをサポート
- app/server: @hoyyeva が #15657 で、デスクトップアプリの起動がアクティブな
ollama launchセッションを終了してしまう問題を修正 - バッチ処理のためのモデル対応 @jessegross が #15814
- 新しいモデル @dhiltgen が #15861
完全な変更履歴: v0.21.3-rc0...v0.22.1-rc0




