広告

MEDIC-AD: 医療ビジョン・言語モデルの臨床インテリジェンスに向けて

arXiv cs.CV / 2026/3/31

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、病変検出、症状の追跡、視覚的な説明可能性を、実世界の臨床利用にとってより実用的にすることを目的とした、臨床志向の医療ビジョン・言語モデル「MEDIC-AD」を提案する。
  • 不常(異常)領域を強調する異常認識トークン(<Ano>)を用いた段階的(stage-wise)フレームワークを採用し、病変中心の表現を改善することで、より正確な異常検出およびセグメンテーションを実現する。
  • 長期縦断(ロングチューディナル)研究における時間的変化を符号化するために、画像間差分トークン(<Diff>)を追加し、疾患の経過を悪化、改善、安定のいずれかに分類できるようにする。
  • 説明可能性のための専用ステージでは、病変に焦点を当てたヒートマップを出力するようにシステムを訓練し、モデルの推論と整合することで、臨床的に忠実な視覚的根拠を提供する。
  • 病院の業務フローに基づく実際の縦断臨床データでの実験により、最先端の性能と、患者モニタリングや意思決定支援の文脈に適した安定した予測が示される。

広告