社会的ナビゲーションのための現実世界学習に向けた漸進的残差強化学習
arXiv cs.RO / 2026/4/10
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は移動ロボットのための社会的ナビゲーションを扱っており、地域ごとの大きな変動により、歩行者のダイナミクスや人々の行動規範を十分にカバーするにはシミュレーション中心の学習だけでは不十分であることを指摘している。
- 軽量な漸進的学習(リプレイバッファやバッチ更新なし)と、ベース方策に対する残差方策のみを学習する残差強化学習を組み合わせた、漸進的残差強化学習(IRRL)を提案する。
- シミュレーション結果により、IRRLが標準的なリプレイバッファ方式の強化学習手法と同等の性能を達成しつつ、従来の漸進的学習アプローチを上回ることが示される。
- 実機での実験では、IRRLを用いたロボットがオンロボット学習によって、これまでに見たことのない環境に対して効果的に適応できることが示され、本手法がエッジデバイスの制約下でも実用的であることを裏付けている。

