データ効率の高い模倣学習のための人-ロボット・コパイロット

arXiv cs.RO / 2026/4/7

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、テレオペレーションによるデモが少数しか利用できない場合にデータ効率の高い模倣学習を改善するための「人-ロボット・コパイロット」フレームワークを提案する。
  • 図式的誤差の累積や環境の確率的性質(ストキャスティシティ)によって、方策が分布外(OOD)状態へドリフトしてしまう問題を対象とする。
  • 提案手法は、熟練的(dexterous)なテレオペレーションに対するスケーリング係数を用いることで、Human-Gated DAgger(HG-DAgger)の考え方を拡張しつつ、多くの産業用および研究用ロボットマニピュレータとの互換性を維持する。
  • 実験により、このフレームワークは、従来のインタラクティブ/ヒューマン・イン・ザ・ループ手法と同じ数のデモンストレーション軌道を用いた場合に、より高いタスク性能を達成できることが示される。
  • 人による修正介入が断続的に必要なだけであるため、データ収集プロセス全体はより効率的であり、連続的な修正戦略よりも必要時間が少ない。