接触を伴う動作を高速化するための漸増的な反復参照学習制御による模倣学習デモンストレーションの改良

arXiv cs.RO / 2026/4/21

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、接触を伴うマニピュレーションにおける模倣学習(IL)で高速デモンストレーションを作る課題を扱い、単純な時間加速が接触ダイナミクスを変えて追従誤差を大きくすると指摘している。
  • Iterative Reference Learning Control(IRLC)を用いて観測された追従誤差から参照軌道を反復的に更新し、高速化しながらも漸進的に速度を上げる手法として Incremental Iterative Reference Learning Control(I2RLC)を提案する。
  • 実ロボット実験(ホワイトボード消去、ペグインホール)により、IRLCとI2RLCはいずれも最大10倍の高速デモンストレーションと追従誤差の低減を達成し、I2RLCは3タスク・複数速度(3〜10倍)においてIRLCより元軌道との空間的類似度を平均22.5%改善した。
  • 改良した軌道でILポリシーを学習すると、デモより速い実行が可能になり、ペグインホールで見た位置・見ない位置の両方で成功率100%を達成するほか、IRLC改良デモで学習した場合より接触力が低い。
  • 以上より、速度スケジューリングを漸進的に行い参照を適応させる組み合わせが、接触を伴う高速な模倣学習の実用的な道筋になることを示している。

Abstract

接触の多い操作を高速に実行することは実用展開にとって重要ですが、模倣学習(IL)のための高速デモンストレーションを提供することは依然として難しい課題です。人間は高速度でデモンストレーションできず、単純にデモを加速すると接触ダイナミクスが変化し、大きな追従誤差が生じます。そこで本研究では、観測された追従誤差から参照軌道を反復的に更新するために、反復参照学習制御(Iterative Reference Learning Control; IRLC)を転用することで、時間加速したデモンストレーションを自律的に改良する手法を提案します。しかしIRLCをそのまま高速度で適用すると、初期反復における誤差が大きくなり、過渡応答が安定しにくい傾向があります。この問題に対処するため、参照を更新しながら速度を段階的に高めるインクリメンタル反復参照学習制御(Incremental Iterative Reference Learning Control; I2RLC)を提案し、高忠実度な軌道を得ます。実験では、コンプライアンス制御された追従器と3Dプリントした触覚リーダを用いたテレオペレーション構成により、実ロボットでホワイトボード消去およびペグ・イン・ホールのタスクを検証しました。IRLCとI2RLCはいずれも、追従誤差を低減しながら最大10倍の高速なデモンストレーションを実現します。さらにI2RLCは、3つのタスクと複数の速度(3倍〜10倍)にわたり、IRLCに対して平均22.5%の割合で、元の軌道に対する空間的な類似性を改善します。次に、改良された軌道を用いてILポリシーを学習します。その結果得られたポリシーは、デモンストレーションよりも高速に実行でき、見たことのない位置を含むペグ・イン・ホール課題で100%の成功率を達成します。また、I2RLCで学習したポリシーは、IRLCで改良したデモンストレーションで学習したポリシーよりも接触力が低いことが示されました。これらの結果は、参照適応と組み合わせた段階的な速度スケジューリングが、接触の多いILを高速に実現するための実用的な道筋を提供することを示しています。