データ効率の高い模倣学習のための人-ロボット・コパイロット

arXiv cs.RO / 2026/4/7

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、テレオペレーションによるデモが少数しか利用できない場合にデータ効率の高い模倣学習を改善するための「人-ロボット・コパイロット」フレームワークを提案する。
図式的誤差の累積や環境の確率的性質（ストキャスティシティ）によって、方策が分布外（OOD）状態へドリフトしてしまう問題を対象とする。
提案手法は、熟練的（dexterous）なテレオペレーションに対するスケーリング係数を用いることで、Human-Gated DAgger（HG-DAgger）の考え方を拡張しつつ、多くの産業用および研究用ロボットマニピュレータとの互換性を維持する。
実験により、このフレームワークは、従来のインタラクティブ／ヒューマン・イン・ザ・ループ手法と同じ数のデモンストレーション軌道を用いた場合に、より高いタスク性能を達成できることが示される。
人による修正介入が断続的に必要なだけであるため、データ収集プロセス全体はより効率的であり、連続的な修正戦略よりも必要時間が少ない。

AI Business

日経XTECH

日経XTECH

日経XTECH

日経XTECH