DynaVid:合成モーションデータを用いて高度にダイナミックな動画を生成する学習
arXiv cs.CV / 2026/4/3
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- DynaVidは、拡散ベースのモデルが高度にダイナミックな動きや細かなモーション制御に苦手意識を持つことに着目した動画合成フレームワークとして導入されます。
- この手法は、コンピュータグラフィックスのパイプラインから得た光学フローを用いて合成モーションの監督信号を生成することで、実トレーニングデータの不足を補い、多様なモーションパターンと精密な制御信号を提供します。
- モーションを光学フローとして表現し、外観から切り離して学習することで、レンダリングされた合成動画に起因して生じうる不自然な視覚アーティファクトの回避を目指します。
- アプローチは2段階のパイプラインを採用します。まずモーションジェネレータでモーションを合成し、次にそのモーションに条件付けてモーション誘導型の動画フレームを生成することで、制御性と現実味の両方を向上させます。
- 激しい人の動きや極端なカメラの動きといったシナリオでの実験により、既存手法と比べて特にデータセットが乏しい場合に、現実味と制御性が改善されることが示されています。




