LSGS-Loc: 大規模UAVシナリオに向けた堅牢な3DGSベース視覚ローカライゼーション

arXiv cs.CV / 2026/4/8

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、大規模UAVシナリオに特化した、幾何学的複雑性や環境変動に対応する3Dガウススラッティング(3DGS)ベースの視覚ローカライゼーション処理パイプラインであるLSGS-Locを提案する。
  • シーン固有の学習を避けつつ、幾何学的に根拠のあるローカライゼーションを維持するために、シーン非依存の相対ポーズ推定と、明示的な3DGSスケール制約を組み合わせたスケール対応(scale-aware)戦略によってポーズ初期化を改善する。
  • ラプラシアンに基づく信頼性マスキング機構を追加することで、ぼやけや浮遊アーティファクトのような再構成アーティファクトがフォトメトリックな精緻化に与える影響を低減し、ポーズ精緻化を強化する。
  • 大規模UAVベンチマークでの実験により、順序なし画像クエリに対して最先端の精度と堅牢性を示し、従来の3DGSベースのローカライゼーション手法を上回る。またコードは公開されている。

要旨: 大規模UAVシナリオにおける視覚ローカライゼーションは自律システムにとって重要な機能である一方、幾何学的な複雑さや環境の変動により依然として難題となっています。3Dガウススパッタリング(3DGS)は有望なシーン表現として登場してきましたが、既存の3DGSベースの視覚ローカライゼーション手法は、大規模環境において頑健なポーズ初期化が難しいことや、レンダリングアーティファクトへの感度が高いことが課題です。これらの制限に対処するために、本研究では大規模3DGSシーン向けに設計された新しい視覚ローカライゼーション・パイプラインであるLSGS-Locを提案します。具体的には、シーン非依存の相対ポーズ推定と、明示的な3DGSスケール制約を組み合わせることで、スケールに応じたポーズ初期化戦略を導入し、シーン固有の学習を行わずに幾何学的に根拠のあるローカライゼーションを可能にします。さらに、ポーズ精緻化においては、ぼけやフロートのような再構成アーティファクトの影響を軽減するために、ラプラシアンに基づく信頼性マスキング機構を開発し、フォトメトリック精緻化を高品質領域へと導きます。大規模UAVベンチマークに対する大規模な実験により、本手法が順序なしの画像クエリに対して最先端の精度と頑健性を達成し、既存の3DGSベース手法を大幅に上回ることが示されます。コードは以下で利用可能です: https://github.com/xzhang-z/LSGS-Loc