因果関係を符号化した拡散モデル:介入サンプリングとエッジ推論

arXiv stat.ML / 2026/4/24

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、既知の有向非巡回グラフ(DAG)を組み込み、グラフの因子分解に整合する条件付き拡散モデルを学習する「因果関係を符号化した」拡散モデルを提案する。
  • 介入サンプリングとして、逆拡散の過程で介入変数を固定し、DAGを通じて因果的影響を伝播させることで、観測分布と介入分布の両方の回復を狙う。
  • 著者らは、候補グラフの下でヌル複製を生成するリサンプリングベースの有向エッジ検定を考案し、観測・介入分布推定の収束性と第1種過誤の制御に関する理論保証を示す。
  • シミュレーションとフローサイトメトリーのデータへの適用により、ベースラインより介入分布の回復が改善し、推論においてサイズがほぼ公称で検出力も良好であることを示す。
  • 理論面では、推定の収束率が周辺(ローカル)次元の最大値に支配され、周辺次元(アンビエント次元)ではない点を強調しており、スケーリング面で有利になり得る。
  • Point 2
  • Point 3

概要: 標準的な拡散モデルは複雑な分布の柔軟な推定器ですが、因果構造をエンコードせず、そのためそれ自体では因果分析を支援しません。本研究では、既知の有向非巡回グラフを取り入れた、因果をエンコードする拡散フレームワークを提案します。具体的には、グラフの因数分解と整合するように条件付き拡散モデルを学習することで実現します。その結果得られるサンプラは観測分布を概ね復元し、逆拡散の過程でグラフを通じて効果を伝播させながら、介入された変数を固定することで介入サンプリングを可能にします。この介入シミュレータに基づき、候補となるグラフの下でヌルな複製(null replicates)を生成する、有向辺のためのリサンプリングに基づく検定を開発します。観測分布および介入分布の推定について収束保証を確立し、その収束速度は周辺(ambient)次元ではなく最大ローカル次元によって決まることを示します。また、辺の検定に対してタイプIエラーの漸近的な制御を証明します。シミュレーションでは、ベースラインと比べて介入分布の復元が改善され、推定においてほぼ公称のサイズと好ましいパワーが得られることが示されます。フローサイトメトリーのデータへの適用により、論争のあるシグナル伝達リンク(signalling linkages)を評価するうえで、本提案手法の実用的有用性が実証されます。