デモから学習した可視運動(ビジュオモータ)ポリシーの安全性を「やるか、やらないか」:安全性確保のために

arXiv cs.RO / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、模倣学習(IL)のポリシーをタスク成功のみで評価することは、現場のロボティクスで重要となる安全性の保証には不十分だと主張しています。
  • 「execution guarantee(実行保証)」という、微小な実行時の変化があっても、状態空間の特定領域内で可視運動型ILポリシーのタスク成功を最大化するための、ポリシー非依存の安全性指標を提案しています。
  • view synthesis(ビュー合成)を用いて、どの状態空間領域が保証に適しているかを特定し、集合不変性(set invariance)の理論と結びつけています。
  • Nagumoの準接線条件(Nagumo’s sub-tangentiality condition)により、execution guaranteeを形式化し、運用可能な形に落とし込んでいます。
  • Frankaロボットでのシミュレーションと実機実験により、保証付きで最大タスク成功を達成できることを示し、さらに得られるリカバリーポリシーが安全性と性能のトレードオフを緩和しうることも報告しています。