CURA：言語モデルに基づくリスク予測における臨床的不確実性のリスク整合

arXiv cs.CL / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、臨床リスク予測に用いる言語モデルの不確実性推定を、より臨床的に信頼できる形で較正する枠組みとしてCURAを提案する。
CURAは、まずドメイン特化の臨床LMを微調整して患者埋め込みを得たうえで、多ヘッド分類器を不確実性重視のバイレベル目的関数で追加学習する。
個人レベルでは、不確実性と各患者の誤り確率を整合させてキャリブレーションを行い、コホートレベルでは埋め込み空間での近傍におけるイベント率へとリスク推定を寄せる正則化を導入する。
MIMIC-IVの臨床リスク予測タスクで、複数の臨床LMに対してCURAが較正指標を一貫して改善しつつ、弁別性能を大きく損なわないことを示す。
さらにCURAは、過信による誤った安心（overconfident false reassurance）を減らし、不確実性を下流の臨床意思決定支援でより信頼できる形にすることを示している。

要旨: 臨床言語モデル（LM）は、自由形式の記載メモから臨床リスク予測を支援するためにますます広く適用されているが、その不確実性推定はしばしば十分に較正されておらず、臨床的に信頼できないままである。本研究では、Clinical Uncertainty Risk Alignment（CURA）という枠組みを提案する。これは、臨床LMに基づくリスク推定と不確実性を、個々の誤りの起こりやすさと、集団レベルの曖昧さの両方に整合させるものである。CURAはまず、タスクに適応した患者埋め込みを得るために、領域特化型の臨床LMを微調整し、次に二水準の不確実性目的関数を用いてマルチヘッド分類器の不確実性微調整を行う。具体的には、個体レベルの較正項が、予測的不確実性を各患者の誤りが起こりやすい確率に合わせ込む。一方、コホートを考慮した正則化項は、埋め込み空間における近傍での事象発生率へとリスク推定を引き寄せ、さらに判断境界付近に存在する曖昧なコホートに対して追加の重みを与える。さらに、このコホートを考慮した項は、近傍に基づくソフトラベルを用いた交差エントロピー損失として解釈でき、我々の手法をラベルスムージングの観点から捉えられることを示す。さまざまな臨床LMにわたるMIMIC-IVの臨床リスク予測タスクに関する大規模な実験により、CURAは識別能を大きく損なうことなく、較正指標を一貫して改善することがわかった。さらなる分析により、CURAは過度に自信のある誤った安心（過信による誤安心）を低減し、下流の臨床意思決定支援に対してより信頼できる不確実性推定をもたらすことが示される。