要旨:クロスモーダル・サーマル・ジオローカライゼーション(TG)は、Global Navigation Satellite System(GNSS)が使用できない環境において、無人航空機(UAV)に対する堅牢で全天候型のソリューションを提供する。しかし、熱画像と可視画像の間に大きなモダリティギャップが存在すると、特徴の曖昧さが深刻化し、従来の粗から精へ(coarse-to-fine)による登録処理を体系的に破壊してしまう。このボトルネックを解消するために、本研究では統合型のセマンティック・ケスケード・コンセンサス・ローカライゼーションフレームワークであるSCC-Locを提案する。グローバルな検索とMINIMA_{\text{RoMa}}のマッチングの両方で単一のDINOv2バックボーンを共有することで、メモリ使用量を最小化し、ゼロショットで非常に高精度な絶対位置推定を実現する。具体的には、3つの結束したコンポーネントによってモダリティの曖昧さに取り組む。第一に、セマンティック誘導ビューポート整合(SGVA)モジュールを設計し、衛星の切り出し領域を適応的に最適化することで、初期の空間的ズレを効果的に補正する。第二に、カスケード化された空間適応型テクスチャ・ストラクチャ・フィルタリング(C-SATSF)機構を開発し、幾何学的整合性を明示的に強制することで、密なクロスモーダル外れ値を根絶する。最後に、物理的制約を課した姿勢最適化の相乗効果によって、最適解を導出するための、コンセンサス駆動・信頼性認識型ポジション選択(CD-RAPS)戦略を提案する。データ不足に対処するために、大規模衛星オルソフォトと、それに空間的に整合したデジタル表層モデル(DSM)を参照した、11,890件の多様な熱クエリを提供する包括的データセットThermal-UAVを構築する。広範な実験により、SCC-Locが新たな最先端を確立し、平均ローカライゼーション誤差を9.37 mに抑え、最強のベースラインに対して厳格な5-mしきい値内で7.6倍の精度向上を達成することが示される。コードとデータセットは https://github.com/FloralHercules/SCC-Loc で利用可能である。
SCC-Loc:UAVサーマル・ジオローカライゼーションのための統一型セマンティック・カスケード・コンセンサス・フレームワーク
arXiv cs.CV / 2026/4/6
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、熱画像と可視画像のモダリティギャップにもかかわらず、GNSSが利用できない環境でのUAVサーマル・ジオローカライゼーションのための統一型セマンティック・カスケード・コンセンサス・フレームワークであるSCC-Locを提案する。
- 共有するDINOv2バックボーンを用いて、グローバルなリトリーバルとMINIMA_RoMaのマッチングの両方を行い、ゼロショットによる絶対位置推定を支えるとともに、メモリ使用量を削減する。
- SCC-Locは、曖昧性や登録誤りに対処するために、3つの構成要素を備える:Semantic-Guided Viewport Alignment(SGVA)、幾何学的整合性のためのCascaded Spatial-Adaptive Texture-Structure Filtering(C-SATSF)、姿勢最適化のためのConsensus-Driven Reliability-Aware Position Selection(CD-RAPS)。
- データ不足を緩和するため、著者らは、大規模な衛星オルソフォトとそれに対応するDSMに整合させた11,890件のサーマル・クエリからなるThermal-UAVデータセットを構築する。
- 実験では新たな最先端性能を報告しており、平均ローカライゼーション誤差を9.37 mに低減し、最も強力なベースラインに対して厳格な5 mしきい値内で7.6×の改善を達成する。コードとデータはGitHubで公開されている。




