腰椎脊柱管狭窄症診断のための、適応PID-Tversky損失を備えた説明可能ビジョン・ランゲージ・モデルの枠組み
arXiv cs.AI / 2026/4/6
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、多視点MRIに基づく腰椎脊柱管狭窄症(LSS)診断を扱い、手作業による負担の大きい読影に起因する遅延や観察者間のばらつきを対象としている。
- テキストに導かれた空間的に正確な脊椎異常の局在化を行うために、Spatial Patch Cross-Attentionモジュールを用いる、エンドツーエンドの説明可能なビジョン・ランゲージモデルを提案する。
- 理論制御に着想を得たAdaptive PID-Tversky Lossを導入し、極端なクラス不均衡や、過小に分割された少数クラスのインスタンスに対するペナルティを動的に調整して、より適切に扱えるようにする。
- 本アプローチは、基盤となるVLMに加えて、セグメンテーション出力を放射線科医スタイルの臨床レポートへ翻訳する自動放射線レポート生成モジュールを組み合わせ、解釈可能性を高める。
- 報告された結果として、分類精度90.69%、セグメンテーションのマクロ平均Dice係数0.9512、CIDErスコア92.80%が示されており、透明性のある監督型臨床AIの新たなベンチマークであるという主張もある。



