要旨: 信頼性が不明な外部事前情報は、因果発見において脆いトレードオフを生みます。盲目的な信頼は誤りを増幅し、盲目的な棄却は信号を無駄にします。実際の事前情報はまた、
\emph{不均一に} 信頼できる――すなわち、物理法則は信頼できる一方で、LLMが提案した辺は推測にすぎません。しかし既存手法は、事前情報を無視するか、あるいは全体を通じて一様な信頼で事前情報を課すかのどちらかです。本研究では、
\textbf{PRCD-MAP} を提案します。これは、未完の事前情報に対して
each辺(
\emph{per-edge})の信頼を割り当てるソフトな事前情報消費(prior-consumption)層であり、事前を考慮した MAP 目的関数のもとで、事前を考慮した \ell_1 ペナルティと、事前で重み付けされた \ell_2 正則化を変調するために用いられます。信頼は、ラプラス近似した限界尤度に対する経験的ベイズ(empirical Bayes)により校正され、事前グラフに沿って MLP によって伝播されます。そのため、データで裏づけられた近傍は信頼を高め、矛盾はそれを抑制します。PRCD-MAP は母集団レベルでの安全性保証を備えており、事前生成分布に関する期待値のもとで \varepsilon-安全です。ここで \varepsilon = O(d^2/T) であり、オラクルの収束率を継承しています。事前情報が非情報的(uninformative)な場合には、学習された信頼が理論的にその下限(floor)へ崩壊することが保証され、この手法は事前情報なしのベースラインを回復します。実験的には、実データの CausalTime において、PRCD-MAP は情報的な事前情報が存在するときに活用します(AQI で +0.123、Medical over PCMCI+ で +0.043 の AUROC 向上)。また匿名変数の Traffic ストレステストでは自動的に減衰し、さらに d{=}300 においても優位を維持します。最も近いソフト・ベイズ的ベースラインである BayesDAG~\citep{annadani2023bayesdag} に対しては、対応する W_0 のみのプロトコルの下で、すべての CausalTime データセットで PRCD-MAP が勝利します。4 方向のアブレーションにより、各コンポーネントを分離すると、得られる改善の大部分は EB の校正と MLP による信頼伝播が共同で担っており、すべてのデータセットで正の符号を示します。非線形(NAM)および横断(cross-sectional)設定への拡張では、校正済み信頼の原理が設定に依存しないことが示されます。
PRCD-MAP:因果発見において不完全な事前知識(プリア)をどれだけ信頼すべきかを学習する
arXiv stat.ML / 2026/5/5
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、因果発見における外部プリアが信頼性未知であると脆くなり、盲目的に信じると誤りが増幅され、盲目的に拒否すると信号を捨ててしまうと主張する。
- その解決として、PRCD-MAPは不完全なプリアに対する「エッジごとの信頼度」を学習し、MAP目的関数の中で prior-aware \(\ell_1\) ペナルティと prior-weighted \(\ell_2\) 正則化を信頼度で調整する仕組みを提案する。
- 信頼度のキャリブレーションは、Laplace近似した周辺尤度に基づく経験ベイズで行い、プリアグラフ上ではMLPを用いて信頼を伝播させることで、データで裏付けられた近傍は信頼を高め、矛盾は抑制する。
- 手法は期待値ベースでの母集団レベルの \(\varepsilon\)-safe という安全性保証を持つとされ、プリアが非情報的な場合には信頼度が下限へ収束し、無プリアのベースラインへ戻ることが示される。
- 実験ではCausalTimeデータにおいて、情報量のあるプリアがあるときにAUROCが改善し、ストレステストでは自動減衰により頑健性を示し、さらに一致プロトコルでBayesDAGを上回る結果が報告される。またアブレーションにより、経験ベイズによるキャリブレーションとMLPによる信頼伝播が主な利益の要因であることが示される。



