概要: クロスビュー地理位置推定(CVGL)は、街路画像の地理的位置を、対応する航空画像と照合することによって推定することを目的とします。これは、複雑な現実世界のシナリオにおける自律走行およびマッピングにとって極めて重要です。しかし、視点差が大きいことと交絡因子の影響により、この課題は依然として難しいままです。これらの問題に対処するために、因果介入を活用して交絡因子の影響を緩和し、モデルが安定したタスク関連の意味表現に焦点を当てるよう促す因果特徴抽出器(CFE)と、鳥瞰図(BEV)ロードトポロジを街路特徴に注入して、極端な視点変換によって生じるクロスビューの不整合を緩和する幾何トポロジー融合(GT Fusion)モジュールを統合する因果学習と幾何トポロジー(CLGT)フレームワークを提案します。さらに、意味的に豊かな領域の表現を強化するためにデータ適応プーリング(DA Pooling)モジュールを導入します。CVUSA、CVACT、およびそれらの堅牢性強化バリアント(CVUSA-C-ALL および CVACT-C-ALL)に対する大規模な実験は、CLGT が最先端の性能を達成しており、特に現実世界の厄介な劣化条件の下で優れていることを示しています。コードは https://github.com/oyss-szu/CLGT で公開されています。
返却形式: {"translated": "翻訳されたHTML"}



