UrbanVGGT:街路ビュー画像からの歩道幅のスケーラブル推定

arXiv cs.CV / 2026/3/25

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • UrbanVGGTは、単一のストリートビュー画像からメートル単位の歩道幅を推定する、スケーラブルなパイプラインとして提示されており、従来手法の希少性やコスト面の制約に対処する。
  • 本手法では、セマンティックセグメンテーション、フィードフォワード型の3D再構成、適応的な地面平面フィッティング、カメラ高さに基づくスケール校正、再構成平面上での方向別の幅測定を統合する。
  • ワシントンD.C.のグラウンドトゥルース・ベンチマークにおいて、UrbanVGGTは平均絶対誤差0.252 mを報告し、推定値の95.5%が参照される幅から0.50 m以内に収まった。
  • アブレーション実験およびジオメトリ・バックボーンの比較から、カメラ高さに基づくメートルスケール校正が精度において最も重要な構成要素であることが示される。
  • 本論文は、3つの都市に対してパイプラインを適用することで実現可能性を示し、527のOpenStreetMapの街路区間をカバーするプロトタイプデータセット(SV-SideWidth)を公開する。一方で、権威ある計画利用の前に、より広範な検証と地域での監査が必要であることにも言及する。