DBMF:外部分布(OOD)検出のためのデュアルブランチ・マルチモーダルフレームワーク

arXiv cs.CV / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、テキスト画像ブランチと視覚のみブランチの両方を用いることで相補的な情報をより効果的に活用する、外部分布(OOD)検出のためのデュアルブランチ・マルチモーダルフレームワークであるDBMFを提案する。
  • 学習後、テキスト画像ブランチ(S_t)と視覚ブランチ(S_v)からそれぞれOODに関連する個別のスコアを生成し、これらを統合して最終的なOODスコアSを得る。Sは閾値ベースのOOD分類に用いられる。
  • 本手法は、内視鏡画像における未見の疾患症例の検出など、ダイナミックな臨床環境における信頼性と汎化性を目標としている。
  • 公開されている内視鏡画像データセットでの実験により、本アプローチは異なるバックボーン構成に対しても頑健であり、最先端のOOD検出性能を最大24.84%向上させることが示される。
  • 中核となる貢献は、単一モダリティの視覚に依存する、または画像-テキスト照合のみに依存する従来のOOD手法の限界を克服することを狙った、マルチモーダル統合戦略である。