MedVeriSeg：追加学習なしでクエリ妥当性を検証するためのMLLMベース医療セグメンテーションモデルの指導

arXiv cs.CV / 2026/4/14

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、LISAのようなMLLMベースの医療セグメンテーションモデルに対して「存在しないターゲットを参照する誤ったクエリ（false queries）」を拒否するための、訓練不要（training-free）フレームワークであるMedVeriSegを提案し、幻覚的なマスク生成の問題に対処する。
それは、真のクエリと偽のクエリで、[SEG]トークン特徴とMLLMの画像特徴の間の類似性マップにおける分布パターンの観測された差異を利用する。
MedVeriSegは、類似性マップを3つの基準——強度（strength）、コンパクトさ（compactness）、純度（purity）——でスコアリングするSimilarity Response Quality Scoring Moduleを追加し、初期の存在予測を生成する。
最終的な検証のために、GPT-4oを用いて類似性ヒートマップとモジュールのスコア出力を共同で評価し、定性的な視覚的証拠を取り込む。
SA-Med2D-20Mから派生した小規模ベンチマークでの実験により、MedVeriSegは誤クエリ要求を効果的に拒否しつつ、真のクエリの認識の信頼性を維持できることが示される。

要旨: MLLMベースの医用画像セグメンテーションにおける最近の進歩にもかかわらず、既存のLISAのような手法では誤ったクエリを確実に拒否できず、存在しないターゲットに対して幻覚的なセグメンテーションマスクを生成することがしばしばあります。この制約は、医療教育および臨床での実用的な信頼性を低下させます。本研究では、トレーニング不要の検証フレームワークであるMedVeriSegを提案し、LISAのような医用セグメンテーションモデルに、「存在しないターゲットを含む誤ったクエリ」を識別して拒否する能力を与えます。私たちの重要な観察は、[SEG]トークン特徴とMLLM画像特徴の間の類似度マップが、真のクエリと偽のクエリで大きく異なる分布パターンを示すという点です。これに基づき、類似度マップを3つの側面（強度、コンパクトさ、純度）から特徴づけるSimilarity Response Quality Scoring Moduleを導入し、まずはターゲットの存在に関する初期予測を生成します。さらに、GPT-4oを用いて、最終的な検証のために、類似度ヒートマップとSimilarity Response Quality Scoring Moduleの結果を共同で評価することにより、定性的な視覚的証拠も取り入れます。SA-Med2D-20Mから構築した小規模ベンチマークにおける実験により、MedVeriSegは、真のクエリの信頼できる認識を維持しつつ、誤ったクエリによるセグメンテーション要求を効果的に拒否できることを示しました。

Black Hat Asia

AI Business

テスラのE2E自動運転技術FSD、オランダ承認「欧州初」一般道で手放し

日経XTECH

リコーのマルチモーダルAI、図面から寸法を読み出し普通公差を適用

日経XTECH

26年の世界半導体売上高、64％増の1.3兆ドル米ガートナー予測

日経XTECH

ソフトバンクなど3社、フィジカルAIへの通信ロボとMECの連係が鍵

日経XTECH

MedVeriSeg：追加学習なしでクエリ妥当性を検証するためのMLLMベース医療セグメンテーションモデルの指導

要点

関連記事

Black Hat Asia

テスラのE2E自動運転技術FSD、オランダ承認「欧州初」一般道で手放し

リコーのマルチモーダルAI、図面から寸法を読み出し普通公差を適用

26年の世界半導体売上高、64％増の1.3兆ドル米ガートナー予測

ソフトバンクなど3社、フィジカルAIへの通信ロボとMECの連係が鍵

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Black Hat Asia

テスラのE2E自動運転技術FSD、オランダ承認 「欧州初」一般道で手放し

リコーのマルチモーダルAI、図面から寸法を読み出し普通公差を適用

26年の世界半導体売上高、64％増の1.3兆ドル 米ガートナー予測

ソフトバンクなど3社、フィジカルAIへの通信 ロボとMECの連係が鍵

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

テスラのE2E自動運転技術FSD、オランダ承認「欧州初」一般道で手放し

26年の世界半導体売上高、64％増の1.3兆ドル米ガートナー予測

ソフトバンクなど3社、フィジカルAIへの通信ロボとMECの連係が鍵