周辺介入データからの同時介入分布の推定

arXiv stat.ML / 2026/4/20

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、観測データと周辺(マージナル)介入データの両方をMaximum Entropyの原理で活用し、全変数の同時条件付き分布を得る手法を提示している。
  • 介入制約を取り込むために因果Maximum Entropyの枠組みを拡張し、ラグランジュ双対性により解がMaximum Entropy解と同様に指数型(exponential family)に属することを証明している。
  • 変数の任意の部分に対して周辺介入分布しか与えられていない場合に、提案手法は(1)観測データと単一変数介入データの混合からの因果特徴選択、(2)同時介入分布の推論、という2つの課題を扱える。
  • 合成データ実験では、データ統合に関する既存の最先端手法を上回り、全変数の同時観測にアクセスが必要なKCI検定と同程度の性能が得られることを示している。

概要: 本論文では、最大エントロピー原理を用いて、介入データを活用することで、すべての変数の同時条件付き分布を獲得する方法を示します。これを行うために、因果最大エントロピー法を拡張し、観測データに加えて介入データを利用できるようにします。ラグランジュ双対性を用いて、介入制約を伴う因果最大エントロピー問題の解が、最大エントロピー解と同様に指数族に属することを証明します。本手法は、任意の変数部分集合に対して周辺介入分布が与えられる場合に、関心のある2つのタスクを実行できます。第一に、観測データと単一変数の介入データの混合から因果的特徴選択を行う方法を示し、第二に、同時介入分布を推論する方法を示します。前者のタスクについては、合成的に生成したデータ上で、本提案手法がデータセット統合に関する最先端手法を上回り、また、すべての変数の同時観測へのアクセスを必要とするKCI検定と同等の結果が得られることを示します。