MR.ScaleMaster: 群衆から収集した単眼動画に基づくスケール整合的な協調的マッピング

arXiv cs.RO / 2026/4/14

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

MR.ScaleMasterは、スケールの崩壊やスケールのドリフトといった問題があるにもかかわらず、群衆から収集した単眼動画からの大規模3D再構成を改善する、arXiv掲載の協調的マッピングシステムである。
反復的な環境において、ポーズグラフを破壊してしまう前に、誤検出のループ閉包（false-positive loop closures）を棄却するための「Scale Collapse Alarm（スケール崩壊アラーム）」を導入する。
通常のSE(3)のポーズ表現を置き換え、Sim(3)アンカーノードの定式化を採用することで、セッションごとのスケールを明示的に推定する。これにより、グローバルなスケールの一貫性を実現し、ロボットごとのスケールの曖昧性を解消する。
KITTIで最大15台のエージェントに対する実験を行い、SE(3)ベースラインに対してATE（Absolute Trajectory Error）を7.2倍低減した。さらに、そのアラームはすべての誤検出ループを棄却しつつ、有効な制約はすべて維持する。
本システムはモジュール化され、オープンソースであるため、異なる単眼再構成バックエンドをプラグアンドプレイで統合できる。MASt3R-SLAM、pi3、VGGT-SLAM 2.0を統一マップへ融合することで、異種の複数ロボットによる高密度マッピングを実証する。

要旨: 単眼カメラによる群衆（クラウドソース）協調マッピングは、専用センサーを必要とせずにスケーラブルな3D再構成を実現できることを約束していますが、それでもなお、2つのスケールに特有な失敗モードによって妨げられています。具体的には、反復的な環境での誤検出ループ閉じ込みによって引き起こされる急激なスケール崩壊、そして長い軌跡にわたる徐々のスケールドリフトと、ロボットごとのスケールの曖昧さによって直接的なマルチセッションの統合が妨げられる問題です。私たちは、これら2つの失敗モードの両方に対処する、群衆ソースの単眼動画のための協調マッピングシステム MR.ScaleMaster を提案します。MR.ScaleMaster は3つの主要な仕組みを導入します。第一に、Scale Collapse Alarm（スケール崩壊アラーム）により、ポーズグラフを破壊する前に、見かけの（spurious）ループ閉じ込みを拒否します。第二に、Sim(3) アンカーノードの定式化により、従来の SE(3) フレームワークを一般化してセッションごとのスケールを明示的に推定し、ロボットごとのスケール曖昧性を解消するとともに、グローバルなスケール整合性を強制します。第三に、モジュール式でオープンソースのプラグ＆プレイ・インターフェースにより、どの単眼再構成モデルでもバックエンドの変更なしに統合できるようにします。最大15体のエージェントを含む KITTI シーケンスにおいて、Sim(3) の定式化は SE(3) のベースラインに対して ATE を 7.2 倍削減し、アラームは有効な制約をすべて保持しながら、すべての偽陽性ループを拒否します。さらに、MASt3R-SLAM、pi3、VGGT-SLAM 2.0 を単一の統合マップ内で融合する、異種のマルチロボットによる高密度マッピングも実証します。