即時リセットは本当に必要?効率的なロボット移動のための衝突ハンドリングの再考

arXiv cs.RO / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本文は、ロボット移動の深層強化学習において多くの場合、訓練中に1回の衝突が起きるとすぐにグローバルな環境リセットが行われ、学習に有益になり得る経験が失われてしまうと主張しています。
  • そこで、Multi-Collision reset Budget(MCB)という枠組みを提案し、局所的な衝突終了とエピソード全体のリセットを切り離して、同一エピソード内で困難な障害物配置に対して再試行できるようにします。
  • シミュレーションと実機ロボットの両方での実験により、MCBは従来の「1回衝突で即リセット」の基準よりも、初期の探索を加速し、成功率と移動効率の両方を改善することが示されています。
  • 衝突予算(リトライ回数)を小さく設定するのが最も効果的で、学習上の利点とリトライ制限のバランスが良いことが示唆されています。