COT-FM: クラスタ別の最適輸送フローマッチング

arXiv cs.CV / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • COT-FMは、確率パスを再構成して高速かつより安定した生成を可能にする、クラスタ単位のフローマッチング手法を導入します。
  • ランダムまたはバッチ単位の結合によって生じる曲線状の軌跡に対処し、離散化誤差を低減し、サンプル品質を向上させます。
  • 本手法はターゲットサンプルをクラスタリングし、各クラスタに事前学習済みのFMモデルを反転させて得られる専用のソース分布を割り当て、局所的な輸送精度を実現します。
  • プラグアンドプレイで、モデルアーキテクチャの変更を一切必要とせず、2Dデータ、画像ベンチマーク、ロボット操作タスク全体でサンプリングを一貫して高速化します。
  • 本研究は、実践的な生成モデリング・パイプラインへの広範な適用性と潜在的な影響を示しています。

要旨: Flow Matching (FM) の確率パスを再構成する一般的なフレームワークであるCOT-FMを導入します。これにより、より速く、より信頼性の高い生成を実現します。FMモデルは、ランダムまたはバッチ単位の結合により曲線的な軌道を生じることが多く、これが離散化誤差を増大させ、サンプル品質を低下させます。COT-FMは、ターゲットサンプルをクラスタリングし、各クラスタに事前学習済みFMモデルを反転させて得られる専用のソース分布を割り当てることでこれを解決します。この分割統治戦略は、局所的な輸送をより正確にし、ベクトル場をより一直線にします。これらはすべて、モデルのアーキテクチャを変更することなく実現します。プラグアンドプレーのアプローチとして、COT-FMは2Dデータセット、画像生成ベンチマーク、ロボット操作タスク全体でサンプリングを継続的に加速し、生成品質を向上させます。