座標ベースの双重制約付き自己回帰モーション生成

arXiv cs.CV / 2026/4/10

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、従来の拡散モデルや自己回帰アプローチよりも忠実度と意味の忠実性を向上させることを目的とした、新しいテキストからモーションへの生成フレームワーク「CDAMD（Coordinate-based Dual-constrained Autoregressive Motion Generation）」を提案する。
モーション座標を入力として用い、自己回帰生成の枠組みと拡散に着想を得た多層パーセプトロンを組み合わせることで、モード崩壊などの一般的な自己回帰の失敗モードを低減する。
「Dual-Constrained Causal Mask（双重制約付き因果マスク）」を導入し、モーション・トークンを事前分布（prior）としてテキスト符号化と連結することで、トークンベースの自己回帰生成を誘導する。
著者らはさらに、テキストからモーション生成およびモーション編集のための新しいベンチマークも導入し、忠実度と意味的一貫性において最先端の結果を報告している。
座標ベースのモーション合成を対象とし、誤差増幅や離散化の問題に対処することで、生成されたモーションをアニメーション、VR、ロボティクス、HCI（ヒューマン・コンピュータ・インタラクション）などの用途でより実用的にすることを目指している。

AI Business

日経XTECH

日経XTECH

日経XTECH

Reddit r/artificial