リーマン幾何ジェネレーティブデコーダ

arXiv stat.ML / 2026/5/5

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、非ユークリッドな固有構造を持つデータを通常のユークリッド空間に埋め込むと歪みが生じうるとして、マンifold(多様体)を意識した表現学習を動機づけています。
  • 「Riemannian generative decoder(リーマン幾何ジェネレーティブデコーダ)」では、リーマン最適化器でマンifold値の潜在変数を学習しつつ、デコーダネットワークのみを同時に学習することでエンコーダを不要にしています。
  • これにより、先行手法で用いられていたエンコーダと密度推定に基づく手順を回避し、数値的に壊れやすい目的関数の最適化を避けつつ、マンifold制約も大幅に単純化できると述べています。
  • 手法は、合成の分岐拡散、人の移動をミトコンドリアDNAから推定する課題、細胞分裂周期のダイナミクスの3つの事例で検証され、学習された潜在変数が意図した幾何を尊重することが示されています。
  • 本手法は「任意のリーマン多様体」に対して適用可能で、既存のアーキテクチャとも整合的で、データ幾何に沿った解釈しやすい潜在空間を得られるとされ、コードもGitHubで公開されています。

Abstract

ユークリッド表現は、本質的に非ユークリッドな構造を持つデータを歪めます。リーマン表現学習は、データを一致する多様体に埋め込むことでこの問題への解決策を提供しますが、通常は、選択した多様体上で密度を推定するためのエンコーダに依存します。これは数値的に脆い目的関数を最適化することを伴い、モデルの学習や品質を損なう可能性があります。この問題を完全に回避するために、我々はリーマン生成デコーダを導入します。これは、任意のリーマン多様体上で多様体値の潜在変数を見つけるための統一的アプローチです。潜在変数はリーマン最適化器で学習され、同時にデコーダネットワークを学習します。エンコーダを捨てることで、現在のアプローチがしばしば少数の特定の多様体にしか対応できないのに対し、多様体制約を大幅に単純化できます。3つのケーススタディ――合成の分岐拡散プロセス、ミトコンドリアDNAから推定された人類の移動、細胞分裂サイクルを進行する細胞――で我々の手法を検証し、それぞれが学習された表現が規定された幾何を尊重し、本質的な非ユークリッド構造を捉えることを示しました。我々の手法はデコーダのみを必要とし、既存のアーキテクチャと互換であり、データの幾何に整合した解釈可能な潜在空間をもたらします。コードは https://github.com/yhsure/riemannian-generative-decoder で公開されています。