AI Navigate

PhyGile: 機敏な汎用ヒューマノイド運動追跡のための物理プリフィックス誘導モーション生成

arXiv cs.AI / 2026/3/23

📰 ニュースModels & Research

要点

  • PhyGile は、ヒューマノイドロボットのための物理プリフィックスに導かれたモーション生成を導入し、262次元の骨格空間で直接ロボット固有のモーションを生成するとともに、推論時のリターゲティングアーティファクトを削減します。
  • 本手法は、カリキュラム型の専門家の混成モデルを用いて GMT コントローラを訓練し、ラベルなしデータ上で追加訓練を行うことで、ロボット固有のモーション生成と General Motion Tracking (GMT) の間のループを結びつけ、大規模モーションに対するロバスト性を向上させます。
  • 物理プリフィックス適応中、GMT コントローラは物理由来のプレフィックスで微調整され、実機ロボットでの機敏かつ安定した実行を可能にします。
  • オフラインおよび実機ロボットの実験により、PhyGile は歩行や低ダイナミック動作にとどまる従来手法を超えた、機敏で高度に難しい全身モーションの追跡能力を拡張することを示しています。

要旨: ヒューマノイドロボットは、実世界の設定で機敏で表現力豊かな全身モーションを実行することが期待されている。
既存のテキストからモーションを生成するモデルは、捕捉された人間のモーションデータセットで主に訓練されており、その事前知識は人間の生体力学、駆動、質量分布、および接触戦略を前提としている。
このようなモーションをヒューマノイドロボットに直接リターゲットすると、得られる軌道は幾何学的な制約(例:関節の制限とポーズの連続性)を満たす場合があり、運動学的には妥当と見える。
しかし、それらは現実世界での実行に必要な物理的実現可能性をしばしば満たさない。
これらの問題に対処するため、PhyGileという統一フレームワークを提案する。これはロボットネイティブのモーション生成とGeneral Motion Tracking(GMT)との間のループを閉じるものである。
PhyGileは推論時に物理プリフィックスに導かれたロボットネイティブのモーション生成を行い、物理ガイド付きプリフィックスを用いた262次元の骨格空間でロボットネイティブのモーションを直接生成することにより、推論時のリターゲットアーティファクトを排除し、生成と実行のずれを減らす。
物理プリフィックス適応の前には、GMTコントローラをカリキュラムベースのエキスパート混成方式で訓練し、その後ラベルなしモーションデータで事後訓練を行い、大規模なロボットモーションに対する頑健性を高める。
物理プリフィックス適応の間、GMTコントローラは物理由来のプリフィックスの下で生成された目的に基づく微調整をさらに行い、実機ロボット上での複雑なモーションを機敏かつ安定に実行できるようにする。
広範なオフラインおよび実機ロボット実験は、PhyGileがテキスト駆動型ヒューマノイド制御の新たな領域を切り開くこと、そして歩行や低ダイナミックモーションをはるかに超える機敏で高度な全身モーションを安定して追従できることを示している。