位相空間における生成モデル

arXiv cs.AI / 2026/4/6

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、深層生成モデル(とりわけ拡散モデルとフローマッチング)が、埋め込み空間上でデータが物理的に制約された部分多様体上にある場合に、高次元の分布をどのように学習・サンプリングできるかを調べる。
  • 相対論的なエネルギー・運動量4元ベクトルとして表される高エネルギー物理イベントについて、物理法則の厳密さを近似的に満たすことは、解釈可能性と信頼性を損なう可能性があると論じる。
  • 中心質量系(CMフレーム)における質量ゼロのN粒子ローレンツ不変位相空間の多様体上に、サンプリングの各ステップにおいて常に留まるよう構成された生成モデルを提案する。
  • 拡散モデルについては、前向きの「純粋なノイズ」終端が位相空間上の一様分布に対応することを示し、粒子相関が逆方向のノイズ除去過程でどのように現れるかを分析するための原理的なベースラインを与える。
  • 著者らは、特異性構造が異なる少数粒子分布と多数粒子分布の学習を実証し、シミュレーションされたジェットデータを用いた今後の解釈可能性研究につなげる位置づけとしている。

要旨: 拡散やフローマッチングといった深層生成モデルは、高次元分布を学習しサンプリングできる強力な機械学習ツールである。特に、学習データがデータ埋め込み空間の部分多様体に集中しているように見える場合に有用である。相対論的なエネルギー・運動量4-ベクトルの集合からなる高エネルギー物理データにおいて、この部分多様体は、エネルギーおよび運動量の保存則など、非常に強い物理的動機づけに基づく事前分布(priors)を強制することができる。これらの制約が、厳密にではなくおおよそとしてのみ学習されてしまうと、そのような生成モデルの解釈可能性および信頼性を損なう可能性がある。この欠点を補うために、われわれは、生成過程のサンプリング軌跡のあらゆるステップにおいて、生成モデルが中心質量系(center-of-momentum frame)における質量ゼロのN粒子ローレンツ不変位相空間の多様体に、構成上(by construction)拘束されるような生成モデルを導入する。拡散モデルの場合、「純粋な雑音(pure noise)」の順方向プロセスの終点は、位相空間上の一様分布に対応し、そこから逆過程(脱雑音化)において粒子間の相関がどのように現れてくるのかを特定するための明確な出発点が得られる。われわれは、提案モデルが、さまざまな特異性構造を持つ少数粒子分布および多数粒子分布の両方を学習できることを示し、シミュレートされたジェットデータで学習した生成モデルを用いた今後の解釈可能性に関する研究への道を開く。

位相空間における生成モデル | AI Navigate