分離したノイズ付きデータ多様体における拡散生成モデルの時間条件付けを探る

arXiv cs.LG / 2026/4/29

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、拡散生成モデルのサンプリングにおいて明示的な時間条件付けが本当に必要かどうかを再検討し、特にDDIMのような決定論的手法での性能低下の理由に迫ります。
  • 著者らは幾何学的な観点から、高次元空間ではノイズ付きデータ分布が入力空間内に埋め込まれた低次元のハイパー円筒状の多様体へ集中する、という主張を示します。
  • この洞察にもとづき、DDIMの順方向プロセスをフローマッチング手法に合わせて多様体の進化が一致するように改良し、時間条件付けなしでも高品質な生成が可能だと示します。
  • さらに、クラスを異なる「時間空間」にデカップリングすることでクラス条件付き生成へ拡張し、クラス非条件付きのノイズ除去モデルでクラス条件付き合成を実現します。
  • 大規模な実験により理論の裏付けがなされ、明示的な条件埋め込みなしでも高品質な生成が達成できる可能性を示したと報告されています。

Abstract

実務的には、拡散モデルの学習では、ネットワークをノイズ除去のサンプリング過程へ導くために、明示的な時間条件付けを行うことが典型的に必要です。特にDDIMのような決定論的手法では、時間条件付けがないことによって大幅な性能低下が生じます。しかし、フローマッチングのような他の決定論的サンプリング手法では、この条件付けなしで高品質なコンテンツを生成できるため、その必要性が問題となります。本研究では、時間条件付けの役割を幾何学的な観点から改めて検討します。前向き拡散過程におけるノイズ付きデータ分布の進化を解析し、高次元空間ではこれらの分布が、入力空間内に埋め込まれた低次元の超円筒(ハイパー・シリンダー)状の多様体へと集中することを示します。生成が成功する理由は、高次元空間においてこれらの多様体がほどけて(分離して)表現されることに起因すると、我々は主張します。この洞察に基づき、DDIMの前向き過程を、フローマッチングのアプローチに合わせて、ノイズ付きデータ多様体がフローマッチング方式に従って進化するならば、時間条件付けなしでもDDIMが高品質なコンテンツを生成できることを証明します。さらに、我々の枠組みをクラス条件付き生成へ拡張します。クラスを異なる時間空間へデカップリング(分離)することで、クラス非条件のノイズ除去モデルを用いたまま、クラス条件付き合成を可能にします。広範な実験により理論解析が裏付けられ、明示的な条件付き埋め込みを用いなくても高品質な生成が達成可能であることが示されます。