脚式ロボットに対する反復学習による筋肉記憶の獲得:適応的かつ高精度な移動をマスターする

arXiv cs.RO / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、反復学習制御(Iterative Learning Control: ILC)と、生物に着想を得た「トルクライブラリ」を組み合わせて、脚式ロボットに筋肉記憶を模倣するための、拡張可能で適応的な移動(ロコモーション)制御フレームワークを提案する。
  • 学習したトルクプロファイルを用いることで、モデル化されていないダイナミクスや外乱下でも軌道追従精度が向上し、さらに周期的な歩容(gait)に限らず、非周期的なタスクにも対応するためにILCを拡張する。
  • この手法はデータ駆動型であり、物理ベースのハイブリッドシステムモデル(軌道最適化から得られるもの)と、リアルタイム学習を結合して、モデル誤差や環境変化を補償する。
  • 主な貢献は、速度・地形・重力の変動に対して、再度学習をやり直す必要なく迅速に適応できる一般化トルクライブラリであり、実行中のオンライン計算を削減する。
  • Cassie(二足)およびA1(四足)に関する実験とシミュレーションでは、数秒以内に関節追従誤差を最大85%低減できること、斜面/地形への適応が確実であること、そして従来の全身(whole-body)コントローラ手法よりも30倍超高速な制御更新レートを達成することが示される。

Abstract

本論文は、反復学習制御(ILC)を生物に着想を得たトルク・ライブラリ(TL)と統合することで、筋肉の記憶に類似した枠組みを備えた脚式ロボット向けの、スケーラブルで適応的な制御フレームワークを提案する。この提案手法は、モデル化されていないダイナミクスや外乱の下での正確な軌道追従など、ロボットの歩行における主要な課題に対処する。周期的な歩容の反復性を活用し、さらにILCを非周期タスクへ拡張することで、この枠組みは多様な歩行シナリオにわたる精度と汎化性を高める。制御アーキテクチャはデータ駆動型であり、ハイブリッドシステムの軌道最適化から導出した物理ベースのモデルと、モデル不確かさおよび外乱を補償するためのリアルタイム学習を組み合わせる。中心的な貢献は、学習した制御プロファイルを保存し、速度・地形・重力条件の変化に対して迅速に適応を可能にする汎用TLの開発であり、反復学習の必要をなくしてオンライン計算を大幅に削減する。提案手法は、二足歩行ロボットCassieおよび四足歩行ロボットA1で、広範なシミュレーションとハードウェア実験により検証される。結果は、本フレームワークが数秒以内に関節の追従誤差を最大85%低減し、傾斜の移動や地形適応を含む、周期的および非周期的な歩容の双方を確実に実行できることを示す。最先端の全身コントローラと比較して、学習されたスキルは実行中のオンライン計算を不要にし、既存手法を上回る30倍超の制御更新レートを達成する。これらの知見は、ILCとトルクメモリを統合することが、非構造的で動的な環境における脚式ロコモーションに対して、高いデータ効率と実用性を兼ね備えた解決策であることを示している。