階層化(stratified)学習への深い生成的アプローチ

arXiv stat.ML / 2026/4/14

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、多くのデータセットは単一の多様体ではなく、次元が異なる多様体の合併として表される階層化空間(unions of manifolds with varying dimensions)としての方が適していると主張し、次元の違いと交差特異点に起因することを理由に、階層化学習を課題として位置づける。
  • 階層化空間上の分布を学習するための2つの深い生成的フレームワークを提案する。ひとつは、次元を意識したVAEの混合に基づくサイーブ(sieve)最大尤度法。もうひとつは、混合のスコア場(score-field)構造を活用する拡散(diffusion)ベースの方法である。
  • 著者らは、周囲(ambient)分布と内在(intrinsic)分布の両方を学習する際の理論的収束率を提示し、性能が内在次元や各層(strata)の滑らかさ、ならびに周囲のノイズに依存することを示す。
  • 分布学習の枠を超えて、スコア場の幾何学を解析し、各層ごとの内在次元推定に関する整合性(consistency)の保証を確立するとともに、層の数とその次元を推定するアルゴリズムを提案する。
  • 分子動力学を含む大規模なシミュレーションおよび実データ実験により、提案手法の有効性を示す。