Switch：ヒューマノイドロボットのためのアジャイルスキル切り替え学習

arXiv cs.RO / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、ヒューマノイドロボットが任意のタイミングでロコモーションスキルを切り替えられるようにする階層型マルチスキル手法Switchを提案している。
Switchは、マルチスキル運動データにおける運動学的類似性に基づいて、スキル間の遷移候補を定めるSkill Graphを用いる。
全身追従ポリシーは深層強化学習でSkill Graph上に学習され、多様なスキルを安定して実行できる。
スキル切り替えや追従の大きな逸脱が起きた際、オンライン・スキルスケジューラがリアルタイムにグラフ探索を行い、実行可能で最適な遷移経路を選ぶ。
実験では、アジャイルなスキル遷移に高い成功率を示しつつ、運動模倣の性能も維持できることが示されている。

要旨: 深層強化学習による全身制御の最近の進展により、人型ロボットは現実世界での困難な歩行スキルにおいて目覚ましい進歩を遂げられるようになった。しかし、既存の手法では、異なるスキル間での柔軟な遷移にしばしば困難があり、それが安全上の懸念や実用上の制約につながっている。この課題に対処するため、我々は、任意の瞬間にシームレスにスキル遷移を可能にする階層型マルチスキルシステム Switch を提案する。本手法は、3つの主要な構成要素からなる: (1) マルチスキル運動データの中で運動学的類似性に基づいて、スキル間の遷移の可能性を定める Skill Graph (SG)、(2) このスキルグラフに基づいて深層強化学習により学習された全身追従ポリシー、(3) 頑健なスキル実行と滑らかな遷移を実現するために追従ポリシーを駆動するオンラインのスキルスケジューラ、である。スキル切り替え、または大きな追従の逸脱が生じる場合、スケジューラはオンラインでグラフ探索を行い、最適で実行可能な経路を見つける。これにより、多様な歩行スキルの効率的で安定したリアルタイム実行が保証される。総合的な実験により、Switch は高い成功率を維持しながら、強力な運動模倣性能を保ちつつ、人型ロボットが機敏なスキル遷移を実行できることが示される。