MedFormer-UR：医療画像分類のための不確実性ルーティング型トランスフォーマ

arXiv cs.AI / 2026/4/13

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、単に高精度に依存するのではなく、較正された不確実性に配慮した予測を提供することで臨床的安全性を向上させる、プロトタイプベースのMedical Vision TransformerであるMedFormer-URを提案する。
Dirichlet分布を用いてトークンごとの証拠（evidential）の不確実性を推定し、曖昧さが生じている箇所をリアルタイムに特定するために、情報をトランスフォーマーを介してルーティングする。
不確実性はトレーニングに能動的な仕組みとして組み込まれており、信頼できない特徴更新をフィルタリングし、ノイズやクラス不均衡を含む臨床データにおいて一般的な過度に自信のある挙動を抑えることを目指す。
クラスごとのプロトタイプを用いて埋め込み空間を構造化し、視覚的類似性に基づいて意思決定できるようにする。
マンモグラフィ、超音波、MRI、病理組織画像に関する実験では、精度の改善が控えめであっても、期待較正誤差（ECE）が最大35%低減し、選択的予測も向上することが示される。

Abstract

安全な臨床統合を確実にするために、深層学習モデルは高い精度だけでなく、信頼できる不確実性の定量化を提供する必要があります。現在の医用ビジョントランスフォーマーは良好に機能していますが、過度に自信のある予測や透明性の欠如といった問題にしばしば苦しんでおり、これらは臨床データのノイズ性と不均衡性によってさらに拡大されます。これに対処するために、プロトタイプに基づく学習と不確実性に導かれたルーティングを組み込んだ修正版メディカル・トランスフォーマー（MedFormer）を強化しました。各トークンに対する証拠（evidential）の不確実性にディリクレ分布を用いることで、提案手法はリアルタイムに曖昧さを定量化し、局在化することができます。この不確実性は単なる出力ではなく、学習プロセスにおける能動的な参加者として機能し、信頼できない特徴の更新を取り除きます。さらに、クラス固有のプロトタイプを用いることで埋め込み空間が構造化された状態に保たれ、視覚的な類似性に基づく判断が可能になります。4つのモダリティ（マンモグラフィ、超音波、MRI、病理組織）にわたるテストにより、提案手法がモデルの校正（calibration）を大幅に改善することが確認されました。期待校正誤差（ECE）を最大35%削減し、精度向上が控えめな場合でも選択的予測が改善します。