SMP:物理ベースのキャラクター制御のための再利用可能なスコアマッチング運動プライオリ
arXiv cs.RO / 2026/4/28
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文では、物理ベースのキャラクター制御向けに、再利用可能でタスク非依存の運動(モーション)プライオリを学習する手法としてScore-Matching Motion Priors(SMP)を提案します。
- 従来の敵対的イミテーション学習の多くがコントローラごとに再訓練を要し、参照モーションデータを下流タスクにも保持する必要があるのに対し、SMPはモーションデータで一度だけ事前学習すれば、その後は再利用できモデル変更が不要です。
- SMPは、事前学習済みのモーション拡散モデルとscore distillation sampling(SDS)を用いて報酬関数を生成し、このモデルを凍結したまま新しい制御ポリシーの学習に利用できます。
- 物理シミュレーションされたヒューマノイドでの実験により、大規模データで学習した一般的な運動プライオリから、スタイル別のプライオリへと転用できるほか、元データにない新しいスタイルも複数スタイルの合成によって作れることを示しています。
- 著者らは、SMPで生成されるモーションが、多様な制御タスクにおいて最先端の敵対的イミテーション学習と同等レベルの品質であると報告しています。




