VGGT-SLAM++
arXiv cs.CV / 2026/4/9
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、Visual Geometry Grounded Transformer(VGGT)から得られる幾何情報に富んだ出力を用いて、測位(オドメトリ)とマッピングの性能を向上させる、完全なビジュアルSLAMシステム「VGGT-SLAM++」を提案する。
- そのパイプラインは、トランスフォーマーに基づくビジュアルオドメトリのフロントエンドと、Sim(3)の解法、DEMベースのグラフ構築モジュール、さらに高キャデンスなローカルバンドル調整(LBA)を復元することを目的としたバックエンドから構成され、軌跡の安定性を高める。
- VGGT-SLAM++は、VGGTの各サブマップごとに高密度な平面カノニカルのデジタル標高モデル(DEM)地図を構築し、それらをパッチでつなぎ合わせ、DINOv2の埋め込みとビジュアル・プレイス認識(VPR)を用いてサブマップを共可視性(covisibility)グラフへ統合する。
- 共可視性ウィンドウ内で空間的な近傍を取得することで、頻繁なローカル最適化を起動し、短いホライズンでの姿勢ドリフトを大幅に低減するとともに、メモリ使用量を抑えつつグラフの収束を改善する。
- 一般的なSLAMベンチマークでの実験により、コンパクトなDEMタイルと準線形(sublinear)な取得を用いて、最先端の精度、より速い収束、グローバルな整合性の維持が報告されている。



