LLMで抽出した共変量による臨床因果推論:統合戦略の再考

arXiv cs.LG / 2026/4/21

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、EHRからの因果推論における重要な制約(自由記述に記載される臨床上の重要な状態が構造化データにないため生じる未測定交絡)に対し、LLMでそれらを構造化共変量として抽出する枠組みを提案する。
  • MIMIC-IVの敗血症患者21,859人を用いて、「早期バソプレシン(昇圧薬)開始が28日死亡率に与える影響」を推定するための7つの統合戦略(表形式ベースライン、従来のNLP表現、3つのLLM拡張アプローチ)を比較する。
  • 結果の中心は、統合戦略によって有効性が大きく異なる点であり、LLM由来の共変量を傾向スコアモデルに直接組み込む方法が最良の性能を示す一方、テキスト由来のカテゴリ距離に基づくデュアル・キャリパー・マッチングはドナー母集団を狭め推定を悪化させ得る。
  • 半合成実験(真の効果が既知)では、LLM拡張傾向スコアによりバイアスが0.0143から0.0003へ大きく低減し、この優位性は抽出誤りを大きく見積もった条件でも維持される。
  • 実データではLLM抽出共変量を取り込むことで推定された治療効果が0.055から0.027へ低下し、CLOVERSランダム化試験と方向性が一致し、さらに二重頑健推定(0.019)が頑健性を裏付ける。