ODEフリーのニューラルフローマッチングによるワンステップ生成モデリング

arXiv cs.LG / 2026/4/9

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ODEフリーの生成モデリング枠組みであるOptimal Transport Neural Flow Matching(OT-NFM)を提案しており、真のワンステップ(1回の順伝播)でサンプル生成を可能にするための直接的な輸送写像を学習する。
  • 過去の「素朴な」フローマップ学習では、ノイズとデータの対応が不一致になることで出力がデータの平均へ収束してしまう「平均崩壊(mean collapse)」が生じ得ると主張している。
  • 著者らは、非退化な学習には一貫した結合(coupling)が必要であることを証明し、この一貫性を強制するために最適輸送に基づくペアリングを提案する。
  • OT-NFMを、合成ベンチマークに加えて画像タスク(MNIST、CIFAR-10)で評価し、拡散モデル/フローモデルに比べて推論時のネットワーク評価回数を大幅に削減しつつ、競争力のある品質を示す。

Abstract

拡散およびフローマッチングモデルは、ノイズをデータへと輸送する積分が時間依存のベクトル場を学習することでサンプルを生成しますが、推論時には数十〜数百回のネットワーク評価が必要になります。代わりに、輸送写像を直接学習します。私たちは、ニューラルフローでフロー写像をパラメータ化する、ODE不要の生成フレームワークであるOptimal Transport Neural Flow Matching(OT-NFM)を提案します。これにより、単一のフォワードパスで真の一ステップ生成が可能になります。素朴なフロ−写像の学習では、ノイズとデータの対応(ペアリング)が不整合であるために、すべての出力がデータの平均へ向かってしまう「平均崩壊」が生じることを示します。縮退しない学習のためには一貫した結合(カップリング)が必要であることを証明し、スケーラブルなミニバッチとオンライン結合戦略による、最適輸送に基づくペアリングを用いてこの問題に対処します。合成ベンチマークおよび画像生成タスク(MNISTおよびCIFAR-10)に関する実験により、推論を単一のネットワーク評価にまで削減しつつ、競争力のあるサンプル品質が示されます。