画像生成のための拡散モデルにおける正則化とフォッカー–プランク残差の分析

arXiv cs.CV / 2026/4/17

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、画像生成のための拡散モデルで、デノイズスコアマッチング(DSM)目的で学習したモデルが、真のデータ密度のダイナミクスを支配するフォッカー–プランク(FP)方程式に違反し得ることを示します。
  • FP偏差を目的関数で直接ペナルティ化するとFP残差は小さくなりますが、計算オーバーヘッドが大きくなることがあると述べられています。
  • 一方で、FP方程式への厳密な準拠を強制しても、生成サンプルの品質が必ずしも改善するとは限らず、弱いFP正則化のほうが良い結果になる場合があることが観察されています。
  • 著者らは、FP残差を狙う軽量な(簡潔な)複数の正則化項を評価し、FP残差の大きさと生成品質の両方への影響を実験的に検証します。
  • その結果、FP正則化の効果の多くを、はるかに低い計算コストで得られる可能性が示され、厳密な強制よりも弱い正則化が有利になることが多いと結論づけています。