EdgeLPR:LiDARの場所認識における精度と性能の深層ニューラルネットワーク間トレードオフ

arXiv cs.RO / 2026/5/5

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • 本論文は、長期自律航法に必要なループクロージャーと安定した地図作成のためのLiDARベース場所認識を、EdgeAIのようなリソース制約下で実装する際の課題を扱っている。
  • Bird’s Eye View表現を用いて画像ベースの軽量ネットワークを可能にする効率的な場所認識手法を提案し、集約ヘッドなしの代表アーキテクチャを統一ディスクリプタ方式でベンチマークしている。
  • FP32、FP16、INT8の各量子化条件下で、グローバルプーリングと線形射影に基づくディスクリプタを用いて性能を評価している。
  • 結果として、FP16はFP32に近い精度を低コストで実現できる一方、INT8はアーキテクチャ依存で精度・頑健性が劣化することが示されている。
  • 著者らは、エッジ展開向けに「用途に応じた」ニューラルネットワーク量子化を今後研究するための有力な基礎を提示したと結論づけている。

Abstract

場所認識は、ループ閉じと一貫した地図作成を可能にし、長期の自律航行のために不可欠である。深層学習は性能を向上させてきたものの、そのようなモデルをリソース制約のあるプラットフォームに展開することは依然として難しい。本研究では、軽量な画像ベースのネットワークを可能にするために、Bird's Eye View表現を活用することでEdgeAI向けの効率的なLiDARベースの場所認識を探究する。集約ヘッドを用いない代表的なアーキテクチャを、グローバルプーリングと線形射影に基づく統一された記述子(ディスクリプタ)方式によりベンチマークし、FP32、FP16、INT8の量子化下で性能を評価する。実験の結果は、精度、頑健性、効率の間にトレードオフがあることを示している。FP16はより低いコストでFP32と一致する一方、INT8はアーキテクチャ依存の劣化を引き起こす。全体として、提示した結果は、エッジ展開のためのニューラルネットワークにおける「ユースケース」対応の量子化に関する今後の研究の強固な基盤となる。