放射線レポート生成のための較正済み信頼度表現
arXiv cs.CL / 2026/4/1
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、医療用LVLMに対する強化学習のファインチューニング手法ConRadを提案する。ConRadは、放射線レポートを生成すると同時に、較正され言語化された信頼度推定を出力し、より安全な臨床レビューを支援する。
- 現在の言語モデルは過度に自信的になりがちな問題に対処し、レポート全体の単一の信頼度スコアと、各主張ごとの文レベルの信頼度の両方を検討する。
- ConRadはGRPOを用い、対数スコアリングルールに基づく報酬関数によって、真に即した自己評価を促し、誤った較正(miscalibration)を罰することで較正を改善する。
- 実験の結果、競合手法に比べて大きな較正向上が示され、臨床評価ではConRadのレポート全体の信頼度が臨床医の判断とよく一致することが確認された。
- このアプローチにより、信頼度の低い記述やレポート全体をフラグ付けして、放射線科医による選択的な検証を可能にする。狙いは、幻覚的(ハルシネーション)な所見が臨床判断に与える影響を低減することにある。




