軽量なリトリーバル強化生成と大規模言語モデルに基づく患者・治験マッチングのためのスケーラブルなモデリング
arXiv cs.AI / 2026/4/27
💬 オピニオンTools & Practical UsageModels & Research
要点
- 本論文は、長大で多様なEHRデータと複雑な適格基準に基づく患者・治験マッチングにおけるスケーラビリティ、汎化性能、計算効率の改善に取り組む。
- リトリーバル強化生成によってEHRのうち臨床的に関連するセグメントを抽出し、LLMベースでそれらを表現へエンコードすることで、処理を2つの要素に明確に分離した軽量パイプラインを提案する。
- 表現は次元削減でさらに洗練し、軽量な予測器を用いて下流の分類を行うことで、全体の計算効率を高める。
- 公開ベンチマーク複数とマヨ・クリニックの実データ(マルチモーダル)で評価した結果、リトリーバルによる情報選択は計算負荷を大幅に下げつつ、臨床的に意味のあるシグナルを保持することが示された。
- 構造化された臨床データでは凍結LLMが強い表現を提供し、非構造化の臨床ナラティブのモデリングには微調整が重要であること、また計算コストを大きく抑えたうえでエンドツーエンドLLMと同等の性能を達成することを示している。



