ロボット探査アルゴリズムにおける動的グラフの学習ベース・スパース化

arXiv cs.RO / 2026/4/21

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • ロボットの探査や動的な経路計画ではグラフ構造を用いることが多いが、時間とともにグラフが肥大化して冗長な情報が蓄積し、性能に悪影響が出るため、探査中のグラフをスパース化する必要がある。
  • 本論文は、Proximal Policy Optimization(PPO)で学習したトランスフォーマーにより、探査中に動的グラフを枝刈りするフレームワークを提案する。
  • RRTベースのフロンティア探査を用いたシミュレーションでは、学習済みポリシーがグラフサイズを最大96%削減できた。
  • 報酬が疎で遅延する状況でも、枝刈りの判断が探査結果と結び付くことの予備的な証拠が示されている。
  • 知的な枝刈りはベースラインより探査率が下がる場合がある一方で、結果のばらつき(標準偏差)が最小となり、環境が変わってもより一貫した探査が得られることが観察される。