広告

安定したAI統合モバイルロボットのためのセマンティックゾーンに基づくマップ管理

arXiv cs.RO / 2026/4/1

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、AI統合モバイルロボットの実運用における課題に取り組む。密な3Dマップと大規模なLLM/VLMコンポーネントはエッジ側のメモリ予算を超えがちで、その結果、キーフレームのロード遅延が発生し、ローカライゼーションが不安定になり、モデル性能にも支障をきたす。
  • 室や廊下などの屋内のセマンティック領域にキーフレームを割り当て、メモリ制約下でゾーンに関連するマップ内容を優先することで、セマンティック・ゾーンベースのマップ管理を提案する。
  • この手法により、キーフレームのロード/アンロード頻度とメモリ使用量を削減し、SLAMとVLM/LLMワークロードを同時に実行した際の運用安定性を向上させる。
  • 大規模な屋内シミュレーション環境およびNVIDIA Jetson Orin Nano上での実験では、幾何学ベースのマップ管理よりも性能が向上した。Qwen3.5:0.8bにより、スループットは+3.3 tokens/s、レイテンシは-21.7%となった。
  • 幾何学ベースの戦略は、メモリ不足(out-of-memory)エラーや、メモリ逼迫時の実行停止が起こり得るのに対し、セマンティックアプローチはこれらの問題を回避し、頑健なVLM動作のためのローカライゼーション安定性を維持する。

Abstract

大規模AIモデル(VLMおよびLLM)の最近の進歩、ならびに3D高密度マップの共同利用により、モバイルロボットは豊かな空間文脈に基づいた、より強力でインタラクティブなサービスを提供できるようになってきました。しかし、エッジのロボット上で重いAIモデルと高密度マップの両方を運用することは、厳しいメモリ予算の下では困難です。メモリ予算を超えると、必要なキーフレームが間に合うように読み込まれない可能性があり、位置推定の安定性が低下し、モデルの性能にも干渉が生じます。本研究では、メモリ制約下で高密度マップの利用を安定化するための、セマンティック領域ベースのマップ管理アプローチを提案します。キーフレームを意味的な屋内領域(例:部屋や回廊)に関連付け、意味的領域レベルでのキーフレーム管理は、メモリ制約を尊重しつつ空間的に関連のあるマップ内容を優先します。これにより、キーフレームの読み込み/読み出し(ロード/アンロード)頻度とメモリ使用量が削減されます。提案手法を、大規模なシミュレーションによる屋内環境と、同時実行のSLAM-VLM処理下でのNVIDIA Jetson Orin Nano上で評価します。Qwen3.5:0.8bにおいて、提案手法は幾何学的なマップ管理戦略に比べてスループットを3.3 tokens/s向上させ、レイテンシを21.7%低減します。さらに、幾何学的戦略はメモリ圧力下でのメモリ不足(out-of-memory)による失敗や実行の停止に悩まされる一方で、提案手法は両方の問題を解消し、ローカライゼーションの安定性を維持しつつ、VLMの堅牢な動作を可能にします。これらの結果は、提案手法が、メモリ制約のある、AI統合モバイルロボットに対して高密度マップを効率的に利用できることを示しています。コードは以下で利用可能です: https://github.com/huichangs/rtabmap/tree/segment

広告