失敗の認識を伴うデモンストレーション学習による安全なロボットナビゲーション

arXiv cs.RO / 2026/4/28

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • 本論文は、学習からのデモンストレーションによるロボットナビゲーションにおける安全性の欠落(成功行動が中心で危険状態のカバレッジが少ない問題)に取り組みます。
  • 衝突などの失敗経験は危険領域を示す重要な情報を含む一方で、それを単純に行動模倣やポリシー学習に組み込むと性能が悪化し得ると指摘しています。
  • 著者らは、成功データと失敗データの役割を明確に分離する「失敗を意識した学習フレームワーク」を提案し、失敗データは危険領域での価値推定に用い、ポリシー学習は成功デモンストレーションのみに制限します。
  • オフライン強化学習の枠組みで、シミュレーションと実ロボットの両方で評価した結果、衝突率を一貫して低減しつつタスク成功率を維持でき、環境やロボットプラットフォームをまたいだ汎化性能も示されました。