生成フローの軌跡方向ストレート化のための等運動学的フローマッチング(Isokinetic Flow Matching)

arXiv cs.LG / 2026/4/7

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • フローマッチング法は、軌跡の重ね合わせによって強い曲率を持つ限界(マージナル)速度場を生成し得ます。これにより数値的な打ち切り誤差が増大し、少数ステップサンプリングの品質が制限されます。
  • 本論文では、軌跡ごとの加速度を罰することで学習中に局所的な速度整合性を強制する、軽量でヤコビアン不要の正則化手法である Isokinetic Flow Matching(Iso-FM)を提案します。
  • Iso-FM は、自律的な有限差分近似によって物質微分を推定し、補助エンコーダや高コストな2階の自動微分を回避します。
  • 単段階FM学習へのプラグアンドプレイ追加として、Iso-FM は少数ステップの画像生成を大幅に改善します。たとえば、CIFAR-10 の DiT-S/2 では、非OT FID が 2 ステップで 78.82 から 27.13 へ低下(約2.9倍の効率化)します。
  • 4 ステップでは、Iso-FM は観測された最良 FID である 10.23 に到達し、加速正則化が、より高速な生成サンプリングのための原理的かつ計算効率の高いアプローチであることを支持します。

要旨: フローマッチング(FM)は線形の条件付き確率経路を構築しますが、学習された周辺(マージナル)速度場は、軌道の重ね合わせによって必然的に強い曲率を示します。この曲率は数値的な打ち切り誤差を著しく増大させ、少ステップサンプリングを詰まらせます。これを克服するために、我々はイソキネティック・フローマッチング(Iso-FM)を提案します。Iso-FMは軽量で、ヤコビアン不要の動力学的レギュライザであり、経路に沿った加速度を直接ペナルティします。物質微分 Dv/Dt の自己誘導型の有限差分近似を用いることで、Iso-FMは補助エンコーダや高コストな2階の自動微分を必要とせずに、局所的な速度の整合性を強制します。単一ステージのFM学習に対する純粋なプラグアンドプレイの追加として動作するIso-FMは、少ステップ生成を大幅に改善します。CIFAR-10(DiT-S/2)において、Iso-FMは2ステップ時の条件付き非OT FIDを78.82から27.13へと切り下げます(相対的効率が2.9倍向上)—さらに4ステップ時には観測上の最良FIDである10.23に到達します。これらの結果は、加速度正則化が高速な生成サンプリングのための、原理に基づき計算効率の高い仕組みであることを確固たるものとして示します。