ベイズ流のビジュアル・トランスフォーマーによるアフォーダンスのインスタンスセグメンテーションにおける不確実性推定

arXiv cs.CV / 2026/5/6

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文は、単なる注目領域ではなく「相互作用可能な領域」を正確かつ局所的に推定することを目的に、アフォーダンスのインスタンスセグメンテーション手法を提案します。
  • サンプルベースおよびアンサンブルによる不確実性推定を用い、ベイズ流のビジュアル・トランスフォーマーで画素ごとの認識論的不確実性(epistemic)とアレアトリック不確実性(aleatoric)を、意味レベルと空間レベルの両方で抽出します。
  • 「Probability-based Mask Quality」という新しい指標を提案し、確率的なインスタンスセグメンテーションにおける意味的・空間的な変動を包括的に分析できるようにし、不確実性出力の解釈性を高めます。
  • 実験では、IIT-Affデータセットにおいて複数のベイズモデルのサブネットワークによるグローバルな合意が決定論的ネットワークを改善し、重み付きFβスコアで+7.4ポイントの向上と、過度に自信過剰にならない確率較正の改善を示しています。