複雑な介入条件下での最適圧縮を用いた因果表現学習
arXiv cs.LG / 2026/3/13
📰 ニュースModels & Research
要点
- 本論文は、個別介入効果(ITE)を推定するための新規なマルチ介入一般化境界を導出し、費用のかかるヒューリスティック調整を排除する最適なバランシングウェイト α の推定量を提案する。
- Pairwise、One-vs-All (OVA)、および Treatment Aggregation の3つのバランシング戦略を分析する。低次元設定ではOVAが優れた精度を発揮し、介入空間が大きい場合には Treatment Aggregation が O(1) のスケーラビリティを実現する。
- 本フレームワークは生成的アーキテクチャである Multi-Treatment CausalEGM へ拡張され、介入多様体の Wasserstein 測地線構造を保持する。
- 半合成データセットと画像データセットを用いた実験により、推定精度と効率の改善が示され、特に大規模介入シナリオで顕著である。
- 本研究は理論と実践を融合させ、複雑な介入体制下で因果表現学習を前進させ、スケーラブルな因果推論への示唆を提供する。
概要: 複数の介入シナリオにおける個別介入効果(ITE)の推定には、ハイパーパラメータの選択のジレンマと、計算スケーラビリティにおける次元の呪いという2つの重要な課題がある。本論文は、新しいマルチ介入一般化境界を導出し、費用のかかるヒューリスティック調整を排除する最適なバランシングウェイト $\alpha$ の理論的推定量を提案する。我々は3つのバランシング戦略を検討する。Pairwise、One-vs-All (OVA)、および Treatment Aggregation。OVA は低次元設定で卓越した精度を達成する一方で、我々の提案する Treatment Aggregation は介入空間が拡大しても精度と O(1) スケーラビリティの両立を保証する。さらに、フレームワークを生成的アーキテクチャである Multi-Treatment CausalEGM に拡張し、介入多様体の Wasserstein 測地線構造を保持する。半合成データセットおよび画像データセットを用いた実験は、我々のアプローチが従来のモデルよりも推定精度と効率で大幅に上回ることを示し、特に大規模介入シナリオで顕著である。


