広告

特徴ガウススパッタリングに基づく最近傍ビュウ合成を用いた階層型ビジュアル再定位

arXiv cs.CV / 2026/4/1

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、既知のシーンに対してカメラ姿勢を推定する階層型ビジュアル再定位フレームワーク「SplatHLoc」を提案し、基盤となるシーン表現として特徴ガウススパッタリング(Feature Gaussian Splatting)を用いる。
  • データベースの観測が疎である場合の扱いを、適応的なビュウ取得手法によって改善する。この手法は、クエリによりよく整合する仮想的な候補ビュウを合成し、初期姿勢推定を強化する。
  • 対応付け(マッチング)では、ガウスによりレンダリングされた特徴による粗いマッチングと、画像から直接抽出した特徴による精密なマッチングを活用するハイブリッド戦略を用いる。これにより相補的な強みを組み合わせることを狙う。
  • 屋内および屋外のデータセットでの実験により頑健性が向上し、ビジュアル再定位において最先端の性能を報告している。

Abstract

可視リローカライゼーションは3Dコンピュータビジョン分野における基礎的な課題であり、既知のシーンを再訪した際にカメラの姿勢を推定します。点ベースの階層型リローカライゼーション手法は、高いスケーラビリティと効率性を示しているものの、疎な画像観測と弱い特徴量マッチングによって制約を受けることが多いです。本研究では、シーン表現としてFeature Gaussian Splattingを用いる、新しい階層型可視リローカライゼーションフレームワークであるSplatHLocを提案します。データベース画像の疎性に対処するために、クエリにより整合した視点を持つ仮想候補を合成する適応的な視点検索手法を提案し、初期姿勢推定の精度を向上させます。特徴量マッチングについて、ガウシアンレンダリングされた特徴と、画像から直接抽出される特徴は、二段階のマッチング処理のそれぞれにおいて異なる強みを持つことを観察します。前者は粗い段階でより良好に機能し、後者は精密な段階でより効果的であることが分かりました。そこで、より正確かつ効率的な姿勢推定を可能にするハイブリッド特徴量マッチング戦略を導入します。屋内および屋外の両方のデータセットに対する広範な実験により、SplatHLocが可視リローカライゼーションの頑健性を高め、最先端の新しい状態を確立することが示されています。

広告