鳥瞰ビュー画像を用いた3D LiDARによる屋内ナビゲーションのためのリアルタイム構造検出

arXiv cs.RO / 2026/3/23

📰 ニュースTools & Practical UsageModels & Research

要点

  • 本論文は、3D LiDARデータを2Dの鳥瞰ビュー画像に投影する軽量でリアルタイムな知覚パイプラインを提案し、資源制約のあるロボットの屋内ナビゲーションにおける効率的な構造検出を可能にする。
  • 古典的な幾何的手法(ハフ変換、RANSAC、LSD)を含む特徴抽出戦略と、YOLO-OBB に基づく深層学習検出器を体系的に評価し、ロバスト性と速度のトレードオフを強調している。
  • YOLO-OBB検出器は、ロバスト性と計算効率の最良のバランスを提供し、GPU加速なしの低消費電力SBC上でエンドツーエンドの10 Hz動作を実現し、雑然とした観測をフィルタリングする。
  • 時空間融合モジュールがフレーム間の検出を統合して安定性を向上させ、標準的なモバイルロボットプラットフォームでの実験はリアルタイム性能と手法の限界を示している。

要旨: 効率的な構造認識は、リソース制約のあるロボットにおけるマッピングと自律ナビゲーションには不可欠である。既存の3D手法は計算量的に膨大であり、一方で従来の2D幾何学的アプローチは頑健性に欠ける。本論文は、3D LiDARデータを2DのBird's-Eye-View(BEV)画像に投影する軽量でリアルタイムなフレームワークを提示し、マッピングとナビゲーションに関連する構造要素の効率的検出を可能にする。この表現の中で、古典的な幾何手法(ハフ変換、RANSAC、LSD)とYOLO-OBBに基づく深層学習検出器を含む、いくつかの特徴抽出戦略を体系的に評価する。得られた検出は、連続するフレーム間の安定性と堅牢性を向上させる時空間融合モジュールを通じて統合される。標準的なモバイルロボットプラットフォーム上での実験は、明確な性能トレードオフを浮き彫りにする。ハフ変換やLSDのような古典的方法は高速な応答を提供するが、ノイズに対して強い感度を示し、LSDはセグメントの過度な断片化を生み出してシステムの混雑につながる。RANSACは堅牢性を向上させるが、リアルタイムの制約を満たさない。対照的に、YOLO-OBBベースのアプローチは、堅牢性と計算効率の最良のバランスを実現し、GPU加速を使用せずに低電力のSBC上で混雑した観測を効果的にフィルタリングしつつ、エンドツーエンドの遅延を10 Hzの動作を満たす形で維持する。本研究の主な貢献は、GPU集約処理に依存できないリソース制約下のロボットプラットフォームにおいて、3D LiDARからの信頼性の高いリアルタイム構造検出を可能にする、計算効率の高いBEVベースの知覚パイプラインである。