要約: オンラインパノプティックマッピングを用いたオープンボキャブラリのシーン理解は、環境を知覚し、環境と相互作用する体現型アプリケーションにとって不可欠です。しかし、既存の方法は主にオフラインであったり、インスタンスレベルの理解を欠いており、現実世界のロボットタスクへの適用可能性を制限しています。本論文では、オンライン設定で3Dガウシアン・スプラットを用いた幾何再構成とオープンボキャブラリ知覚を統合する、新規で有効なシステムOnlinePGを提案します。技術的には、オンラインパノプティックマッピングを実現するために、スライディングウィンドウを用いた効率的なローカルからグローバルへのパラダイムを採用します。ローカルの一貫性マップを構築するために、幾何的手掛かりと意味的手掛かりを共同で活用する3Dセグメントクラスタリンググラフを構築し、スライディングウィンドウ内の不整合なセグメントを完全なインスタンスへ統合します。次に、グローバルマップを更新するために、局所的な3Dガウスマップの空間属性を持つ明示的なグリッドを構築し、それらを堅牢な双方向の二部3Dガウスインスタンスマッチングを介してグローバルマップへ融合します。最後に、統合されたVLM特徴を3D空間属性グリッド内で活用し、オープンボキャブラリのシーン理解を実現します。広く使用されているデータセットで行われた広範な実験により、我々の手法はオンラインアプローチの中でもより高い性能を達成しつつ、リアルタイムの効率性を維持することを示しています。
OnlinePG: 3D ガウシアン・スプラッティングによるオンラインオープンボキャブラリパンオプティックマッピング
arXiv cs.CV / 2026/3/20
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- OnlinePG は、3D ガウシアン・スプラッティングを用いて幾何再構成とオープンボキャブラリ認識を統合したオンラインのオープンボキャブラリパンオプティックマッピングシステムを導入します。
- 本手法はスライディングウィンドウのローカル-グローバルパラダイムを用い、リアルタイム性能を維持しつつ、局所的な3Dセグメントクラスタリンググラフを構築して不整合なセグメントを完全なインスタンスへと融合します。
- グローバルマップの更新は、局所的な3Dガウス分布を明示的な空間グリッドで表現し、それらを頑健な双方向の二部グラフ3Dガウスインスタンスマッチングで統合することによって行われます。
- このアプローチは3D空間グリッド内で Vision-Language Model の特徴を活用し、オープンボキャブラリのシーン理解を可能にします。
- 標準データセットでの大規模な実験により、オンライン手法の中で最先端または競合的な性能を示しつつ、リアルタイムの効率を維持します。

