追跡を簡単に:ヒューマノイド全身制御のためのニューラル・モーション・リターゲティング

arXiv cs.RO / 2026/3/24

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、ヒューマノイドロボットに対する従来の最適化ベースのモーション・リターゲティングは本質的に非凸であり、多くの場合ローカル最適に陥ることで、関節のジャンプや自己貫通といったアーティファクトが生じることを指摘している。
  • そこで提案するのがNMR(Neural Motion Retargeting)であり、リターゲティングを、最適解を直接探索するのではなく、人間のモーションから力学を考慮した写像を学習する問題として捉え直す。
  • NMRはClustered-Expert Physics Refinement(CEPR)を導入し、VAEベースのモーションクラスタリングによって異質なデモンストレーションを潜在モチーフとして整理することで、ロボットの実現可能なモーション・マニフォールド上へモーションを投影/修復する、非常に多数の並列強化学習エキスパートの計算コストを削減する。
  • さらに、グローバルな時間文脈を用いる非自己回帰型のCNN-Transformerを訓練し、再構成ノイズを抑制し、リターゲティング中の幾何学的「トラップ」を回避する。
  • Unitree G1のヒューマノイドにおける、武術やダンスといった複数のタスクでの実験では、関節のジャンプが解消され、自己衝突が減少し、下流の全身制御ポリシーがより速く収束することが報告されている。

Abstract

ヒューマノイドロボットは複雑な環境に統合するために多様な運動スキルを必要としますが、人間データからの運動学的および動力学的な身体化(エンボディメント)のギャップを橋渡しすることは依然として大きなボトルネックです。そこで本研究では、ヘッセ行列解析により、従来の最適化ベースのリタ―ゲティングが本質的に非凸で局所解に陥りやすいことを示します。その結果、関節のジャンプや自己貫入のような物理的アーティファクトが生じます。これに対処するため、最適解を最適化するのではなく、学習によってデータ分布を扱う形へとターゲティング問題を再定式化します。提案手法は NMR(Neural Motion Retargeting)であり、静的な幾何学マッピングを、ダイナミクスを意識した学習プロセスへと変換します。まず、VAE ベースのモーションクラスタリングを用いて、異種の動作を潜在モチーフにグループ化する階層型データパイプラインである Clustered-Expert Physics Refinement(CEPR)を提案します。この方針により、大規模並列な強化学習エキスパートの計算オーバーヘッドが大幅に削減されます。すなわち、エキスパートは、人間のデモンストレーションに含まれるノイズをロボットの実現可能な運動多様体へ射影し、修復します。得られた高忠実度なデータは、再構成ノイズを抑制し、幾何学的な罠を回避するためにグローバルな時間的文脈を推論する、非自己回帰型の CNN-Transformer アーキテクチャを教師付きで学習させます。Unitree G1 ヒューマノイドに対して、武術やダンスのような多様な動的タスクで実験を行った結果、NMR は最先端のベースラインと比べて、関節ジャンプを解消し、自己衝突を大幅に低減することを示しました。さらに、NMR が生成するリファレンスは、下流の全身制御ポリシーの収束を加速し、人間とロボットの身体化ギャップを橋渡しするためのスケーラブルな道筋を確立します。