画像ジオロケーションモデルのオブジェクト単位の説明:GeoGuessrユースケース
arXiv cs.CV / 2026/5/5
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、画像ジオロケーションモデルが、GeoGuessrで人間が推測に使うのと同様のオブジェクト単位の視覚手がかり(道路標示、植生、建築の詳細など)に基づいて予測しているのかを検証します。
- Grad-CAMのような一般的なアトリビューションは拡散した領域を示しやすく、特定の物体や知覚可能なパターンと結びつけにくいことを踏まえ、アトリビューションからサリエント領域を抽出してオブジェクトらしい要素にセグメント化するオブジェクト中心の分析パイプラインを提案します。
- セグメント化した要素の予測への寄与を、削除・挿入テストで評価し、同程度の面積カバレッジを持つランダム領域と、アトリビューション誘導のクロップを比較します。
- 3か国ベンチマークでの実験では、アトリビューション誘導のクロップがランダムクロップよりもモデル予測に必要な情報をより多く保持することが確認されます。
- 著者らは、アトリビューションマップが解釈可能で知覚可能な要素に分解できることを示す一歩として、ジオロケーションモデルのオブジェクト単位の説明に向けた展望を述べています。




