暗黙的多様体上の拡散過程

arXiv cs.LG / 2026/4/9

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、点群サンプルのみを用いて、チャート、射影、その他の明示的な幾何学的プリミティブを必要とせずに、基底となる低次元多様体上の拡散をモデル化するデータ駆動型の確率微分方程式(SDE)を提案する。
  • 近傍グラフをデータから構築し、その上で拡散の微小生成作用素とキャレ・デュ・シャン(CDC)を推定することで、周囲空間(アンビエント空間)上に拡散を構成する。これらは局所的な確率構造と幾何学的構造を同時に捉える。
  • サンプル数が増加すると、得られた暗黙的な拡散過程が、対応する滑らかな多様体上で定義された拡散に対して、法則(分布)として収束することを著者らが証明する。
  • 本研究では「Implicit Manifold-valued Diffusions(IMDs:暗黙的多様体値拡散)」を導入し、学習された多様体に配慮した拡散ダイナミクスを実用的に近似するための数値シミュレーション手法として、オイラー・丸山(Euler–Maruyama)積分による方法を提示する。
  • このアプローチは、多様体に配慮したサンプリング、探索、生成モデリングのための厳密な基盤として位置付けられており、機械学習タスクにおける固有(intrinsic)拡散の利用に関するさらなる研究の方向性を促す。

Abstract

高次元データはしばしば、低次元多様体の近傍にあるものとしてモデル化されます。本研究では、このデータ多様体上における拡散過程を、暗黙(implicit)の設定で構成する方法を調べます。すなわち、点群サンプルのみを用い、チャート、射影、あるいはその他の幾何学的プリミティブにはアクセスせずに行います。本研究の主な貢献は、基底となる多様体上の固有の拡散を捉えるデータ駆動型のSDEでありながら、それが外部(周囲)空間上で定義される点にあります。その構成は、データから構築した近接グラフに基づいて、拡散の微小生成作用素(infinitesimal generator)と、そのキャレ・デュ・シャン(carr\'e-du-champ; CDC)を推定することに依存しています。生成作用素とCDCはいずれも、意図した拡散の局所的な確率構造および幾何学的構造を符号化します。サンプル数が増大するにつれて、誘導される過程が確率過程のパスの空間において、その滑らかな多様体対応物へと法(law)として収束することを示します。この構成を、Implicit Manifold-valued Diffusions(IMDs)と呼びます。さらに、オイラー=丸山(Euler-Maruyama)積分を用いた数値シミュレーション手順も提示します。これにより、データ多様体上の拡散ダイナミクスを実装するための実践的な基盤が厳密に与えられ、さらに、多様体を意識したサンプリング、探索、生成モデリングの新たな方向性が開かれます。