要旨: ランダムな順列に対する不変性は分子のポイントクラウド生成において基本的ですが、多くの拡散モデルは順序付き空間上の順列同変ネットワークを介して間接的にそれを課しています。私たちは、すべての原子の順列を同一視する商多様体 \tilde{\calX}=\sR^{d\times N}/S_N 上で拡散を直接モデル化することを提案します。\tilde{\calX} 上の熱核は、順列上でのユークリッド空間の熱核の和として明示的な形で表せることを示し、商による拡散が順序付き粒子における拡散とどのように異なるかを明確にします。訓練では、S_N 上の扱いにくい(intractable)な和を含む順列対称化されたスコアが必要です。私たちは、順列に関する事後分布上の期待値としての表現を導出し、それを順列空間上のMCMCによって近似します。評価は、EQGAT-Diffプロトコルにより、QM9上での非条件付き3D分子生成を対象に行います。SemlaFlowスタイルのバックボーンを用い、すべての変数を連続的に扱います。その結果、商に基づく順列対称化が実用的であり、効率が改善されつつ競争力のある生成品質が得られることが示されます。
無条件分子生成のための置換対称化拡散
arXiv cs.LG / 2026/3/25
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、順序付き入力に対する置換同変ネットワークで間接的に置換対称性を強制するのではなく、置換商多様体 \(\tilde{\mathcal{X}}=\mathbb{R}^{dN}/S_N\) 上で直接定義された、無条件の3次元分子生成のための拡散モデルを提案する。
- 商上での熱核の明示的な形を導出し、全原子の置換にわたるユークリッド熱核の和として表すことで、「商拡散」が標準的な順序付き粒子の拡散とどのように異なるかについての洞察を与える。
- 学習は、\(S_N\) に対する計算不可能な和を含む置換対称化スコアを中心に定式化されており、著者らはこれを置換に関する事後分布上の期待値として書き換え、置換空間上でのMCMCにより近似する。
- EQGAT-Diffプロトコル(SemlaFlowスタイルの連続バックボーン)に基づくQM9での実験により、商に基づく置換対称化が実用的であり、改善された効率とともに競争力のある分子生成品質を達成できることが示される。
