要旨: 全身を対象とする人型ロボットの運動はロボティクスにおける基本的な課題であり、人間のような振る舞いを可能にするために、バランス、協調、適応性が求められます。しかし、既存の手法では通常、各運動につき複数の学習サンプルが必要であり、高品質な人間のモーションデータセットの収集は労力とコストの両面で負担が大きくなります。そこで本研究では、補助的な歩行モーションと歩行で学習されたベースモデルとともに、歩行を伴わない1つのターゲット・サンプルから新しい人型モーションを学習する、データ効率の高い適応アプローチを提案します。中核となる考え方は、順序を保持する最適輸送(order-preserving optimal transport)を用いて、歩行系列と非歩行系列の間の距離を計算し、その後、測地線(geodesics)に沿った補間によって新しい中間のポーズ骨格を生成することです。生成された骨格は、まず衝突のない構成に最適化され、その後人型ロボットへリターゲットされ、強化学習によるポリシー適応のためにシミュレーション環境へ統合されます。CMU MoCapデータセットに対する実験評価の結果、本手法は一貫してベースラインを上回り、各評価指標において優れた性能を達成することが示されました。コードは以下で公開しています: https://github.com/hhuang-code/One-shot-WBM。
歩行の事前知識を用いたヒューマノイド全身運動のワンショット適応
arXiv cs.RO / 2026/4/8
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、歩行しない単一のターゲット・サンプルから全身ヒューマノイド運動を適応するためのデータ効率の高い手法を提示し、大規模なモーションデータセットの必要性を低減する。
- 歩行および非歩行の運動系列間の類似度を、順序を保持する最適輸送(order-preserving optimal transport)で測定し、その後、測地線(geodesic)上を補間して中間のポーズ・スケルトンを合成する。
- 合成されたポーズは衝突のない構成に最適化され、シミュレーションで使用する前にターゲットのヒューマノイド・プラットフォームへリターゲット(再割り当て)される。
- 方策の適応はシミュレーション環境での強化学習により行い、適応されたモーションを活用して制御を改善する。
- CMU MoCapデータセットでの実験により、評価指標においてベースライン手法に対して一貫した改善が示され、著者はGitHubでコードを公開している。



