MRGeo: 空間・チャネル特徴強化による破損画像の堅牢なクロスビュー地理位置推定

arXiv cs.CV / 2026/3/16

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • MRGeo は、ぼかしや悪天候などの画像劣化下でも効果を維持する、堅牢なクロスビュー地理位置推定(CVGL)に向けた新しい体系的手法です。
  • 空間・チャネル強化ブロックを導入します。その構成要素は、動的融合を伴うグローバルおよびローカル特徴を持つ空間適応表現モジュール(Spatial Adaptive Representation Module)と、多階層のチャネル依存性調整を行うチャネルキャリブレーションモジュール(Channel Calibration Module)です。
  • 最終記述子に幾何学的構造を課すことで、深刻な劣化下の空間的ずれを防ぐ領域レベルの幾何整列モジュール(Region-level Geometric Alignment Module)を含んでいます。
  • 実験結果は、3つの頑健性ベンチマーク(CVUSA-C-ALL、CVACT_val-C-ALL、CVACT_test-C-ALL)において平均 R@1 が 2.92 ポイント改善され、領域間での強い汎化性を示しています。
  • 本研究は、破損下での堅牢な CVGL に対する初の体系的アプローチとして MRGeo を位置づけ、実世界でのデプロイメントに向けた信頼性の向上を強調します。

概要: クロスビュー地理位置推定 (CVGL) は、対応する地理タグ付き衛星画像を検索することによって、ストリートビュー画像を正確に位置決定することを目指します。従来の研究は特定の標準データセットでほぼ完璧な性能を達成してきましたが、実世界のノイズを伴う環境における頑健性は未だ十分に検証されていません。この見落としは、ぼかしや天候といったノイズの影響を受ける画像で性能が著しく低下したり、場合によっては失敗を招いたりする原因となり、実用的な展開を大幅に制限します。この重大なギャップに対処するため、汚染下での頑健なCVGLのために設計された初の体系的手法MRGeoを導入します。MRGeoは、特徴の内在的品質を高め、次に頑健な幾何学的事前情報を課す階層的防御戦略を採用します。その中核は Spatial-Channel Enhancement Block で、次の構成を含みます。 (1) Spatial Adaptive Representation Module は、グローバル特徴とローカル特徴を並行してモデリングし、特徴信頼性に基づいてそれらの融合を仲裁する動的ゲーティング機構を用います。 (2) Channel Calibration Module は、情報損失を補うために、マルチグラニュラリティのチャネル依存関係をモデリングして補償的な調整を行います。深刻な汚染の下での空間的不整合を防ぐため、リージョンレベルの幾何整列モジュールは最終的な記述子に幾何学的構造を課し、粗粒度の一貫性を保証します。頑健性ベンチマークと標準データセットの双方を対象とした包括的な実験は、MRGeoが3つの包括的な頑健性ベンチマーク(CVUSA-C-ALL、CVACT\_val-C-ALL、CVACT\_test-C-ALL)において平均R@1の改善を2.92%達成するだけでなく、エリア間評価においても優れた性能を示し、その頑健性と汎用性を示しています。