座標ベースの双重制約付き自己回帰モーション生成

arXiv cs.CV / 2026/4/10

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、従来の拡散モデルや自己回帰アプローチよりも忠実度と意味の忠実性を向上させることを目的とした、新しいテキストからモーションへの生成フレームワーク「CDAMD(Coordinate-based Dual-constrained Autoregressive Motion Generation)」を提案する。
  • モーション座標を入力として用い、自己回帰生成の枠組みと拡散に着想を得た多層パーセプトロンを組み合わせることで、モード崩壊などの一般的な自己回帰の失敗モードを低減する。
  • 「Dual-Constrained Causal Mask(双重制約付き因果マスク)」を導入し、モーション・トークンを事前分布(prior)としてテキスト符号化と連結することで、トークンベースの自己回帰生成を誘導する。
  • 著者らはさらに、テキストからモーション生成およびモーション編集のための新しいベンチマークも導入し、忠実度と意味的一貫性において最先端の結果を報告している。
  • 座標ベースのモーション合成を対象とし、誤差増幅や離散化の問題に対処することで、生成されたモーションをアニメーション、VR、ロボティクス、HCI(ヒューマン・コンピュータ・インタラクション)などの用途でより実用的にすることを目指している。