フィッシャー幾何学による潜在拡散可能性の理解

arXiv cs.LG / 2026/4/6

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、拡散モデルが潜在空間においてどれほど「拡散可能(diffusable)」であり続けるかを、拡散軌道に沿ったMMSEの変化率を追跡することで測定するための形式的手法を提案する。
  • MMSEの変化を、フィッシャー情報(FI)とフィッシャー情報レート(FIR)という寄与に分解し、グローバルな等長性はFIに一致し、FIRはエンコーダの局所的な幾何に依存することを示す。
  • 潜在幾何学的な歪みを、次元圧縮、接線方向の歪み、曲率注入という3つの測定可能なペナルティを用いて定量化し、潜在拡散の劣化を説明する。
  • FIR(したがって拡散可能性)が空間をまたいで保存されるための理論的条件を導出し、拡散のための潜在オートエンコーダの設計/診断のための基準を与える。
  • 複数のオートエンコーダ・アーキテクチャにまたがる実験により枠組みを検証し、FI/FIRに基づく指標を、潜在拡散の失敗モードを特定し軽減するための診断スイートとして提示する。