縦断データにおける反実仮想アウトカム分布のための因果拡散モデル

arXiv stat.ML / 2026/4/15

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 複数時点で治療判断が患者状態に依存する縦断データにおける反実仮想のアウトカム予測は、時点依存の交絡や不十分な不確実性推定のため難しいという課題を扱っています。
  • 提案手法として、縦断的な逐次介入下で反実仮想アウトカムの「分布全体」を生成することを目的に設計されたCausal Diffusion Model(CDM)を提示しています。
  • CDMは残差型のdenoisingアーキテクチャとリレーショナル・セルフアテンションを用い、複雑な時間依存性や多峰性の軌跡を捉えつつ、従来の明示的なdeconfounding(例:逆確率重み付けや対立的バランシング)を不要にするとしています。
  • 既存研究でも用いられる薬物動態-薬力学の腫瘍成長シミュレータで評価した結果、最先端の縦断因果推論手法に対して分布精度(1-Wasserstein距離)で15〜30%の相対改善を達成し、点推定精度(RMSE)も高交絡条件で競争的または優位であったと報告されています。
  • 不確実性定量と堅牢な反実仮想予測を、逐次交絡が強い状況に統合した意思決定支援ツールとしての有用性が示されています。

Abstract

時系列データにおいて、逐次的な治療決定が変化し続ける患者状態に強く依存する状況で反実結果(カウンターファクト)を予測することは重要ですが、複雑な時変交絡と既存手法における不十分な不確実性定量化のため、これまで一貫してとても難しい課題として知られています。私たちは、逐次介入のもとで反実結果の確率分布全体を明示的に生成することを目的に設計された、初めてのデノイジング拡散確率的(denoising diffusion probabilistic)アプローチである因果拡散モデル(Causal Diffusion Model: CDM)を提案します。CDMは、新規の残差デノイジング・アーキテクチャとリレーショナル自己注意機構を採用し、交絡に対して明示的な補正(例:逆確率重み付け、または敵対的バランジング)を必要とせずに、複雑な時間的依存関係とマルチモーダルなアウトカム軌跡を捉えます。先行研究で広く採用されている薬物動態‐薬力学の腫瘍成長シミュレータを用いた厳密な評価では、CDMは縦断的因果推論の最先端手法を一貫して上回り、高交絡の状況下でも競争的またはそれ以上の点推定精度(RMSE)を維持したまま、分布の正確さ(1-Wasserstein距離)において15-30%の相対的改善を達成しました。複雑で逐次的に交絡する状況において、個別調整(デコングフージング)に特化した手法を用いずに、不確実性定量化と頑健な反実結果予測を統合することで、CDMは医療、政策評価、そしてその他の縦断領域における意思決定支援のための柔軟で高インパクトなツールを提供します。