要旨: Pearlの因果階層は、観測的・介入的・反実仮想的な問いが質的に異なることを示します。私たちはこの問いの定量的な版を問います。すでに下位段の因果的な答えが分かっているとき、より上位段の因果的な答えを特定するために追加で必要となるビット数はいくつか、です。私たちは、クエリ族のために、あるSCM(構造因果モデル)が誘導する答えオラクルのコルモゴロフ複雑性である「クエリクラス記述長」を通じてこれを形式化します。私たちの主要な構成は、観測分布の記述長が一定である二値の非循環SCMを与えますが、単一変数の介入的な答えオラクルの記述長は になります。次数に依存した上界は、入次数
\Theta(n^2)d の有限ゲートスキーマSCMでは、観測—介入ギャップが高々 O(nd \log(en/d) + n \log n) であることを示し、密なレジームでは二次の構成が順序(オーダー)的に最適であり、入次数が有界な場合は根付き木の構成が順序的に最適になります。二次の分離は、すべての固定された に対して、
\varepsilon < 1/4-正確な全変動距離(total-variation)による記述のもとでも保持されます。次の段では、完全な「hard-do(困難なdo)」介入オラクルであっても、なお
\varepsilon の反実仮想的な記述ギャップを残し得ます。一般的な「曖昧さからビットへの定理」とシャノン類似は、これらのギャップが、より低次の項までの範囲で、残余の上位段の曖昧さの対数に等しいことを示します。
\Theta(n)
因果記述ギャップ:パールの因果階層にわたる情報理論的分離
arXiv stat.ML / 2026/5/5
📰 ニュースModels & Research
要点
- 本論文はパールの因果階層を定量的に捉え、下位段の因果回答を知っている場合に、上位段の因果回答を記述するのに追加で必要なビット数を検討します。
- 「クエリ・クラスの記述長」を導入し、構造因果モデル(SCM)によって誘導される回答オラクルのコルモゴロフ複雑性を用いて、クエリ集合ごとの記述コストを定式化します。
- 著者らは二値の非循環SCMの構成を示し、観測分布の記述長が定数である一方で、単一変数の介入回答オラクルはΘ(n²)ビットを要することを示し、密な状況では次数として最適な二次分離を得ています。
- 入次数dに依存する次数感度の上界も提示し、有限ゲートスキーマSCMでは観測–介入のギャップが高々O(nd log(en/d) + n log n)であることを示し、ε-正確な全変動(total variation)記述下でも二次ギャップが頑健に保たれることを示します。
- さらに次の段の反実仮想(カウンターファクト)におけるギャップがΘ(n)残ることを特徴づけ、あいまいさからビット数への定理およびシャノン型アナロジーにより、これらの情報ギャップが残存する高次のあいまいさの対数に等しいことを述べます。




