考えてから進む:画像目標ナビゲーションのための階層的推論

arXiv cs.RO / 2026/4/21

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文は、見えない環境で画像によって指定された目標地点へエージェントを誘導する「画像目標ナビゲーション」を扱い、距離が遠い、または別の部屋にある場合にエンドツーエンド方策が失敗しやすいことを指摘しています。
  • Hierarchical Reasoning Navigation(HRNav)は、問題を高レベルの計画と低レベルの実行に分解することで、長期的(ロングホライゾン)なナビゲーションを扱いやすくすることを提案しています。
  • 高レベル計画では、自ら収集したデータセットで学習したビジョン言語モデルにより、「ドアを通るべきか、廊下を進むべきか」といった短期ホライゾンの指示(プラン)を生成します。
  • 低レベル実行では、短期ホライゾンのプランに条件付けられたオンライン強化学習方策で行動を決定し、さらにさまよう問題を抑えるための Wandering Suppression Penalty(WSP)を導入しています。
  • シミュレーションと実環境の両方で広範な実験を行い、HRNavが既存手法より優れていることを示しており、階層設計とさまよい抑制の有効性を裏付けています。