MedVeriSeg:追加学習なしでクエリ妥当性を検証するためのMLLMベース医療セグメンテーションモデルの指導

arXiv cs.CV / 2026/4/14

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、LISAのようなMLLMベースの医療セグメンテーションモデルに対して「存在しないターゲットを参照する誤ったクエリ(false queries)」を拒否するための、訓練不要(training-free)フレームワークであるMedVeriSegを提案し、幻覚的なマスク生成の問題に対処する。
  • それは、真のクエリと偽のクエリで、[SEG]トークン特徴とMLLMの画像特徴の間の類似性マップにおける分布パターンの観測された差異を利用する。
  • MedVeriSegは、類似性マップを3つの基準——強度(strength)、コンパクトさ(compactness)、純度(purity)——でスコアリングするSimilarity Response Quality Scoring Moduleを追加し、初期の存在予測を生成する。
  • 最終的な検証のために、GPT-4oを用いて類似性ヒートマップとモジュールのスコア出力を共同で評価し、定性的な視覚的証拠を取り込む。
  • SA-Med2D-20Mから派生した小規模ベンチマークでの実験により、MedVeriSegは誤クエリ要求を効果的に拒否しつつ、真のクエリの認識の信頼性を維持できることが示される。

要旨: MLLMベースの医用画像セグメンテーションにおける最近の進歩にもかかわらず、既存のLISAのような手法では誤ったクエリを確実に拒否できず、存在しないターゲットに対して幻覚的なセグメンテーションマスクを生成することがしばしばあります。この制約は、医療教育および臨床での実用的な信頼性を低下させます。本研究では、トレーニング不要の検証フレームワークであるMedVeriSegを提案し、LISAのような医用セグメンテーションモデルに、「存在しないターゲットを含む誤ったクエリ」を識別して拒否する能力を与えます。私たちの重要な観察は、[SEG]トークン特徴とMLLM画像特徴の間の類似度マップが、真のクエリと偽のクエリで大きく異なる分布パターンを示すという点です。これに基づき、類似度マップを3つの側面(強度、コンパクトさ、純度)から特徴づけるSimilarity Response Quality Scoring Moduleを導入し、まずはターゲットの存在に関する初期予測を生成します。さらに、GPT-4oを用いて、最終的な検証のために、類似度ヒートマップとSimilarity Response Quality Scoring Moduleの結果を共同で評価することにより、定性的な視覚的証拠も取り入れます。SA-Med2D-20Mから構築した小規模ベンチマークにおける実験により、MedVeriSegは、真のクエリの信頼できる認識を維持しつつ、誤ったクエリによるセグメンテーション要求を効果的に拒否できることを示しました。

MedVeriSeg:追加学習なしでクエリ妥当性を検証するためのMLLMベース医療セグメンテーションモデルの指導 | AI Navigate