予測エントロピーは医療ビジョン-言語モデルにおけるキャリブレーションとパラフレーズ感度を結びつける
arXiv cs.LG / 2026/4/13
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、医療ビジョン-言語モデルにおける2つの主要な安全性リスク——不適切にキャリブレーションされた信頼度と、質問の言い換え(パラフレーズ)への感度——が、意思決定境界に近いことに関連する共通のメカニズムを持つと主張している。
- 著者らは、MedGemma 4BITに対して、5つの不確実性定量化手法を、分布内のMIMIC CXRと分布外のPadChestでベンチマークし(さらにLLaVA RAD7Bでクロス・アーキテクチャ検証を実施)、1回のフォワードパスから得られる予測エントロピーが、誤りの起こりやすさと、言い換えによりどのサンプルが反転(予測が変化)するかの両方を予測できることを示した。
- 結果として、予測エントロピーは、信頼できない予測とパラフレーズに敏感な予測の双方を、単一のエントロピー閾値でフラグ付けでき、MedGemmaではAUROC約0.711、LLaVA RAD7Bでは0.878を達成した。
- 本研究では、5メンバーのLoRAアンサンブルがデータセットシフト(MIMIC→PadChest)下でキャリブレーションと精度を低下させる一方、LLaVA RADアンサンブルはより頑健であることが分かった。
- 単一モデル手法の中では、MC Dropoutが最も良いキャリブレーション(報告されたECEが最小)と選択的予測のカバレッジを示したが、それでも予測エントロピーは、誤り検出のAUROCおよびパラフレーズ・スクリーニングの両面でアンサンブルより優れていた。




