SING3R-SLAM:3D再構成の事前知識を用いたサブマップベースの屋内単眼ガウスSLAM

arXiv cs.RO / 2026/4/6

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • SING3R-SLAMは、増分的なグローバル3D再構成の改善を目的とした、グローバルに整合性のあるガウスベースの屋内単眼SLAM手法として提案される。
  • このフレームワークは、永続的な「グローバル・ガウス・マップ」を微分可能なメモリとして用いることで、先行手法にありがちな累積ドリフトやスケール不整合といった問題を低減する。
  • サブマップ単位でのグローバルアラインメントにより局所ジオメトリの再構成を行い、その後、グローバル・マップから得られる整合性を活用して局所ジオメトリをさらに精緻化する。
  • 実環境データセットでの実験により、10%以上のポーズ精度の向上や、より細かく詳細な3Dジオメトリといった、最先端の結果が示される。
  • 本手法は、コンパクトでメモリ効率の高いグローバル表現を維持しつつ、ポーズ推定やノベルビュー(新規視点)レンダリングなどの複数の下流アプリケーション向けに効率的な3Dマッピングを可能にすることが報告されている。

Abstract

最近の高密度3D再構成の進展により、局所的な幾何を正確に捉える強い能力が示されています。しかし、SLAMシステムで必要とされるインクリメンタルなグローバル再構成へこれらの手法を拡張することは、依然として困難です。グローバルな幾何学的一貫性を明示的にモデル化しない場合、既存のアプローチはしばしば蓄積ドリフト、スケール不整合、局所幾何の最適でない結果に悩まされます。これらの問題に対処するため、我々はSING3R-SLAMという、グローバルに一貫したガウスベースのモノキュラー屋内SLAMフレームワークを提案します。我々の手法は、持続的で微分可能なメモリとして機能するGlobal Gaussian Map(グローバルガウスマップ)によりシーンを表現し、サブマップレベルのグローバルアラインメントを通じて局所的な幾何学的再構成を取り込み、さらにグローバルマップの一貫性を活用して局所幾何をより洗練させます。この設計により、複数の下流アプリケーションに対して効率的かつ汎用的な3Dマッピングが可能になります。大規模な実験の結果、SING3R-SLAMは姿勢推定、3D再構成、ニュー ビュー レンダリングにおいて先端(state-of-the-art)の性能を達成することが示されています。10%以上の姿勢精度の向上を実現し、より細かく詳細な幾何を生成するとともに、実世界データセット上でコンパクトでメモリ効率の良いグローバル表現を維持します。