広告

統計的に効率の高い因果推論のための局所因果探索

arXiv stat.ML / 2026/4/1

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、調整集合の選択においてグローバル手法の統計的効率を達成しつつ、局所的アプローチの計算効率を維持することを目的とした因果探索手法「LOAD(Local Optimal Adjustments Discovery)」を提案する。
  • LOADはまず、目標変数間の因果効果が同定可能かどうかを判断するために、局所情報のみを用いる。これは、最適な調整集合を計算できるかどうかを左右する。
  • 同定可能である場合、LOADは、治療の可能な子孫を探索し、結果の親を導くために改変した禁則射影(forbidden projection)を用いることで、最適な調整集合を推論する。
  • 同定可能でない場合でも、LOADは局所的に妥当(健全)な親の調整集合を返すため、最適性が保証できない状況でも正しさが担保される。
  • 合成データセットおよび現実的データセットでの実験により、LOADはグローバルな因果探索手法よりもスケールが良く、効果推定において標準的な局所手法よりも精度が向上することが示される。

Abstract

因果発見(causal discovery)手法は、基礎となる因果グラフが未知であっても、2つの目標変数の組に対する因果効果推定のための妥当な調整集合(adjustment set)を特定できます。グローバルな因果発見手法は、因果グラフ全体を学習することに焦点を当てるため、最適な調整集合、すなわち漸近分散が最小となる集合の回復を可能にしますが、変数数が増えると計算上すぐに破綻します。ローカルな因果発見手法は、目標変数の局所近傍(ローカル近傍)に焦点を当てることで、よりスケーラブルな代替手段を提供しますが、統計的に劣った調整集合に制約されます。本研究では、局所手法の計算効率とグローバル手法の統計的最適性を組み合わせた、健全かつ完全な因果発見アプローチであるLocal Optimal Adjustments Discovery(LOAD)を提案します。まず、LOADは目標同士の間の因果関係を特定し、局所情報のみを用いて因果効果が同定可能(identifiable)かどうかを検査します。同定可能であれば、処置(treatment)の可能な子孫を見つけ、修正されたforbidden projectionにおいて結果(outcome)の親として、最適な調整集合を推論します。一方、同定可能でなければ、局所的に妥当な親調整集合を返します。合成データおよび現実的データに関する実験では、LOADはスケーラビリティにおいてグローバル手法を上回り、さらにローカル手法よりも正確な効果推定を提供します。

広告