ポステリア・オーグメンテッド・フロー・マッチング

arXiv cs.CV / 2026/5/4

📰 ニュースModels & Research

要点

  • フロー・マッチング(FM)は高次元の画像データでは学習信号が疎で高分散になりやすく、その結果「フローの崩壊」により汎化性能が低下する可能性がある。
  • 本論文では、Posterior-Augmented Flow Matching(PAFM)として、単一ターゲットによる監督を、途中状態と条件に対して妥当なターゲット補完の事後分布にもとづく期待値へ置き換える。
  • PAFMは、この扱いにくい事後分布を(i)仮定した終点の下での途中の尤度と(ii)条件付きでの終点の事前確率に分解し、重要度サンプリングで複数候補ターゲットの混合を構成する。
  • 著者らはPAFMが元のFM目的に対する不偏推定量を与え、学習中の勾配分散を大幅に抑えられることを理論的に示す。
  • 実験ではPAFMがFID50Kで最大3.4改善し、モデル規模・アーキテクチャ(SiT、MMDiT)・クラス/テキスト条件付きベンチマーク(ImageNet、CC12M)で効果が確認され、計算コスト増はごくわずかである(コード公開あり)。