要旨: 最小記述長 (MDL) の原理に基づく二変量因果発見のアプローチは、各因果方向におけるモデルの(計算不能な)コルモゴロフ複雑度を近似し、総複雑度がより低いものを選択する。前提は、自然のメカニズムは真の因果順序においてより単純であるということである。本質的に、各方向における記述長(複雑度)には、原因変数の記述と因果メカニズムの記述の両方が含まれる。本研究では、現在の最先端のMDLベース手法は、原因変数の記述長を推定するという問題を適切に扱えておらず、実質的に判断を因果メカニズムの記述長に委ねてしまっている、と主張する。レート・歪み理論に基づき、基礎となる分布を代表する歪みの水準を達成するのに必要な最小レートに対応する、原因の記述長を測る新しい方法を提案する。この歪みの水準は、ヒストグラムに基づく密度推定の規則を用いて導出し、一方レートは漸近近似に基づく情報次元の概念を用いて計算する。これを因果メカニズムに対する従来のアプローチと組み合わせることで、rate-distortion MDL(RDMDL)と呼ぶ新しい二変量因果発見手法を導入する。実験により、RDMDLがT"ubingenデータセット上で競争力のある性能を達成することを示す。すべてのコードと実験は、github.com/tiagobrogueira/Causal-Discovery-In-Exchangeable-Dataで公開されている。
レート・ディストーションMDLによる二変量因果発見:情報次元アプローチ
arXiv cs.LG / 2026/4/8
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、最小記述長(MDL)原理とレート・ディストーション理論に基づく新しい二変量因果発見手法「RDMDL(rate-distortion MDL)」を提案する。
- 先行するMDLベースの因果発見手法は、原因変数からの記述長への寄与を誤って見積もってしまい、その結果、方向の判断が因果メカニズムに過度に引っ張られると主張する。
- RDMDLは、ヒストグラムベースの密度推定から推定される歪みレベルに到達するために必要な最小レートによって、原因の記述長を見積もる。
- 手法は情報次元に基づく漸近近似を用いてレートを計算し、それを因果メカニズムに対する従来の記述長アプローチと組み合わせる。
- Tübingenデータセットでの実験により、RDMDLが競争力のある結果を達成することが示されており、著者らは公開可能なコードと実験結果を提供している。




