反復的な運動模倣（Iterative Motion Imitation）を用いた自転車型ロボットでのフリップ・スタント

arXiv cs.RO / 2026/3/31

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本研究は強化学習により自転車型ロボットで前方宙返り（フリップ）を実現し、実行が困難で不完全な参照モーションを模倣するための枠組みを提示した。
その課題に対し、Iterative Motion Imitation（IMI）という反復的な運動模倣手法を提案し、過去の方策ロールアウトから得た軌道を繰り返し参照することで、最初は不可能だった参照からでも実行可能で機敏な行動へ学習を導くとした。
実験では自転車ロボットUMVで、モデルベース制御により生成した「自己衝突を伴うテーブルから地面へのフリップ参照」を用いて、地面から地面、地面からテーブルへの前方フリップを可能にする方策を学習した。
単発のモーション模倣と比べてIMIは成功率が高く、さらに現実世界へのロバストな転移（sim-to-real）も示した。
執筆者らは、当該プラットフォームで無補助のアクロバティックなフリップを達成した最初の事例だと主張している。

Abstract

本研究では強化学習により自転車ロボットで前方宙返り（フロントフリップ）を実現することを示し、特に実行困難で不完全な参照動作を模倣することで達成している。これに対処するため、事前の方策ロールアウトによって生成された軌道を反復的に模倣する手法として、Iterative Motion Imitation(IMI) を提案する。運動学的または動力学的に実現不可能な初期参照から始めることで、IMIは実現可能で機敏な行動へとつながる方策の学習を支援する。我々は、機敏な行動を可能にするよう設計された自転車ロボットである Ultra-Mobility Vehicle (UMV) 上で手法を実証する。モデルベースのコントローラによって生成された、自身が自己衝突するようなテーブルから地面への反転参照から、地面から地面への、ならびに地面からテーブルへの前方宙返りを可能にする方策を学習できることを示す。単発のモーション模倣と比べて、IMI は成功率の高い方策をもたらし、さらに現実世界へ頑健に転移できることを示す。知る限り、このようなプラットフォーム上での無補助の曲芸的な宙返り行動としては初めてである。