閉ループ操作のための参照対応ビジュオモータ政策学習

arXiv cs.RO / 2026/4/8

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、外れ分布エラーや動的な軌道の再ルーティング下でのロボット操作の頑健性を高めるために、元のエキスパートデモンストレーションのみを学習に用いる「参照対応ビジュオモータ政策(ReV)」を提案する。
  • ReVは、人間(またはプランナ)が、軌道を導くための疎な参照点を提示できるようにすることで、密な追加注釈を必要とせずにリアルタイムの閉ループ再計画を可能にする。
  • 本手法は、結合した拡散ヘッドを用いる。すなわち、グローバルヘッドが時間的に疎なアクションアンカーを生成し、当該シーケンス内で参照点がどこに適合するかを特定する。一方、ローカルヘッドは、参照点の時間的位置に基づいてアンカー間を補間する。
  • 学習は、エキスパートデモンストレーションに対して狙いを定めた摂動を加えることで行い、著者らは追加のデータ収集やファインチューニングなしで、困難なシミュレーションタスクおよび実環境タスクにおいて成功率が高いことを報告している。