Combi-CAM:説明可能な画像地理位置推定のための新しい多層アプローチ

arXiv cs.CV / 2026/3/26

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、予測された位置の背後にあるモデルの推論を理解することを目的とした、CNNベースの惑星規模の画像地理位置推定のための新しい説明可能性手法「Combi-CAM」を提案する。

Abstract

想定される地理的位置(画像に描かれた場所)を、画像の視覚的特徴のみに基づいて推定するという、惑星規模のフォトジオロケーションは、複雑な課題である。深層学習モデル、とりわけ畳み込みニューラルネットワーク(CNN)は、この分野を大きく前進させてきたが、予測の背後にある推論を理解することはいまだ困難である。本論文では、通常は最深層の情報だけを用いる代わりに、ネットワーク構造の複数の層から得た勾配重み付きクラス活性化マップを組み合わせることで、CNNベースのジオロケーションモデルの説明可能性を高める新しい手法 Combi-CAM を提案する。本アプローチにより、さまざまな画像特徴がモデルの意思決定にどのように寄与しているかをより詳細に理解でき、従来の手法よりも深い洞察を得られる。