Flip Stunts on Bicycle Robots using Iterative Motion Imitation

arXiv cs.RO / 3/31/2026

📰 NewsSignals & Early TrendsIdeas & Deep AnalysisModels & Research

Key Points

  • 研究は強化学習により自転車型ロボットで前方宙返り(フリップ)を実現し、実行困難で不完全な参照モーションを模倣する枠組みを提示した。
  • その課題に対し、Iterative Motion Imitation(IMI)という反復的な運動模倣手法を提案し、過去の方策ロールアウトから得た軌道を繰り返し参照することで、最初は不可能だった参照からでも実行可能で機敏な行動へ学習を導くとした。
  • 実験では自転車ロボットUMVで、モデルベース制御により生成した「自己衝突を伴うテーブルから地面へのフリップ参照」を用いて、地面から地面、地面からテーブルへの前方フリップを可能にする方策を学習した。
  • 単発のモーション模倣と比べてIMIは成功率が高く、さらに現実世界へのロバストな転移(sim-to-real)も示した。
  • 執筆者らは、当該プラットフォームで無補助のアクロバティックなフリップを達成した最初の事例だと主張している。

Abstract

This work demonstrates a front-flip on bicycle robots via reinforcement learning, particularly by imitating reference motions that are infeasible and imperfect. To address this, we propose Iterative Motion Imitation(IMI), a method that iteratively imitates trajectories generated by prior policy rollouts. Starting from an initial reference that is kinematically or dynamically infeasible, IMI helps train policies that lead to feasible and agile behaviors. We demonstrate our method on Ultra-Mobility Vehicle (UMV), a bicycle robot that is designed to enable agile behaviors. From a self-colliding table-to-ground flip reference generated by a model-based controller, we are able to train policies that enable ground-to-ground and ground-to-table front-flips. We show that compared to a single-shot motion imitation, IMI results in policies with higher success rates and can transfer robustly to the real world. To our knowledge, this is the first unassisted acrobatic flip behavior on such a platform.