複雑な介入条件下での最適圧縮を用いた因果表現学習

arXiv cs.LG / 2026/3/13

📰 ニュースModels & Research

共有:

要点

本論文は、個別介入効果（ITE）を推定するための新規なマルチ介入一般化境界を導出し、費用のかかるヒューリスティック調整を排除する最適なバランシングウェイト α の推定量を提案する。
Pairwise、One-vs-All (OVA)、および Treatment Aggregation の3つのバランシング戦略を分析する。低次元設定ではOVAが優れた精度を発揮し、介入空間が大きい場合には Treatment Aggregation が O(1) のスケーラビリティを実現する。
本フレームワークは生成的アーキテクチャである Multi-Treatment CausalEGM へ拡張され、介入多様体の Wasserstein 測地線構造を保持する。
半合成データセットと画像データセットを用いた実験により、推定精度と効率の改善が示され、特に大規模介入シナリオで顕著である。
本研究は理論と実践を融合させ、複雑な介入体制下で因果表現学習を前進させ、スケーラブルな因果推論への示唆を提供する。

概要: 複数の介入シナリオにおける個別介入効果（ITE）の推定には、ハイパーパラメータの選択のジレンマと、計算スケーラビリティにおける次元の呪いという2つの重要な課題がある。本論文は、新しいマルチ介入一般化境界を導出し、費用のかかるヒューリスティック調整を排除する最適なバランシングウェイト $\alpha$ の理論的推定量を提案する。我々は3つのバランシング戦略を検討する。Pairwise、One-vs-All (OVA)、および Treatment Aggregation。OVA は低次元設定で卓越した精度を達成する一方で、我々の提案する Treatment Aggregation は介入空間が拡大しても精度と O(1) スケーラビリティの両立を保証する。さらに、フレームワークを生成的アーキテクチャである Multi-Treatment CausalEGM に拡張し、介入多様体の Wasserstein 測地線構造を保持する。半合成データセットおよび画像データセットを用いた実験は、我々のアプローチが従来のモデルよりも推定精度と効率で大幅に上回ることを示し、特に大規模介入シナリオで顕著である。

仕様駆動開発における自己改良エージェント

Dev.to

誰かこれを試したことはありますか？ Flash-MoE: ノートパソコンで3,970億パラメータのモデルを動かす

Reddit r/LocalLLaMA

M2.7のオープンウェイト、約2週間で公開予定

Reddit r/LocalLLaMA

MiniMax M2.7 ウェイト公開予定

Reddit r/LocalLLaMA

Claude Codeに最適なオープンソースのコーディングモデルは？LB?

Reddit r/LocalLLaMA

複雑な介入条件下での最適圧縮を用いた因果表現学習

要点

関連記事

仕様駆動開発における自己改良エージェント

誰かこれを試したことはありますか？ Flash-MoE: ノートパソコンで3,970億パラメータのモデルを動かす

M2.7のオープンウェイト、約2週間で公開予定

MiniMax M2.7 ウェイト公開予定

Claude Codeに最適なオープンソースのコーディングモデルは？LB?

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer