LoD-Loc v3: インスタンスシルエット整列を用いた密集都市における一般化空中ローカリゼーション

arXiv cs.CV / 2026/3/23

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

LoD-Loc v3 は、セマンティックシルエット整列からインスタンスシルエット整列へ移行することにより、密集した都市環境における一般化された空中ローカリゼーションを導入します。
新しい合成データパイプラインが InsLoD-Loc を作成します。これは空中画像向けの最大規模のインスタンスセグメンテーションデータセットで、10万枚の画像と正確な建物の注釈を備え、ゼロショット一般化を可能にします。
本手法はシーン間一般化と密集建物シーンでの失敗に対処し、密集した都市部における姿勢推定の曖昧さを低減します。
広範な実験により、LoD-Loc v3 がシーン間および密集都市シナリオの両方で最先端のベースラインを大幅に上回ることが示されました。
本プロジェクトは以下のURLでオンライン公開されています：https://nudt-sawlab.github.io/LoD-Locv3/