キャリブレーション済みアライメントによる共変量ミスマッチ下のRCTベース治療効果推定の改善 (CALM)

arXiv cs.LG / 2026/3/20

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 共変量ミスマッチにもかかわらず、RCTと観察研究を組み合わせて異質な治療効果推定を改善する新しい手法 CALM(Calibrated ALignment under covariate Mismatch)を提案する。
  • 各データソースの特徴を共通表現へ写像する埋め込みを学習し、RCTの埋め込み空間で観測データのアウトカムモデルをキャリブレーションすることで、無作為化に基づく因果識別性を保持する。
  • 有限標本リスク境界は、アライメント誤差、アウトカムモデルの複雑さ、およびキャリブレーションの複雑さに分解され、埋め込みベースのアライメントが補完法より有効となる条件を明らかにする。
  • キャリブレーションに基づく線形バリアントはネガティブ転移に対する保護を提供する一方、ニューラル・バリアントは分布シフトが厳しい場合に脆弱となり得る;疎な線形モデルの下では、埋め込みは補完を一般化する。
  • 51設定を対象としたシミュレーションでは、CALMは線形ケースにおいて線形CATEと同等であることを示し、ニューラル埋め込みバリアントは非線形領域のすべてで大きなマージンを持って勝利した。

要旨: ランダム化比較試験(RCT)は異質な処置効果を推定する際の標準手法であるが、効果異質性を検出するにはしばしばパワー不足である。大規模観察研究(OS)は条件付き平均処置効果(CATE)推定のためにRCTを補完できるが、重要な障壁は共変量のミスマッチである。二つのソースは異なる共変量を測定し、部分的にしか重複していない共変量を含む。私たちは CALM(Calibrated ALignment under covariate Mismatch)を提案する。これは欠測値の補完を回避するために、各データ源の特徴を共通の表現空間へ写像する埋め込みを学習する。OS のアウトカムモデルをRCTの埋め込み空間へ移し、試験データを用いて較正することで、ランダム化からの因果識別性を保持する。有限標本リスク境界は、アライメント誤差、アウトカムモデルの複雑さ、キャリブレーションの複雑さの項へ分解され、埋め込みアライメントが補完より優れている状況を特定する。キャリブレーションベースの線形変種の下では、負の転移に対する保護を提供する。一方、ニューラル変種は極端な分布シフトの下で脆弱になる可能性がある。疎な線形モデルの下では、埋め込みアプローチは補完を厳密に一般化する。51件の設定にわたるシミュレーションは、(i) 線形 CATE に対してキャリブレーションベースの手法が等価であること、(ii) ニューラル埋め込み変種がすべての22の非線形レジーム設定で大きなマージンをもって勝利することを確認した。