合成データ拡張が制御可能なヒューマン中心のビデオ生成に果たす役割の探究
arXiv cs.CV / 2026/4/24
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、動きと外見を明示的にガイドできる制御可能なヒューマン中心のビデオ生成において、合成データがどのように役立つかを検証します。
- 大規模で多様かつプライバシーに配慮したヒト向け動画データセットが不足していることがボトルネックであり、特に希少なアイデンティティや複雑な行動で問題が大きいと指摘します。
- 著者らは、外見と動きの細かな制御を可能にし、学習中に合成データと実データがどう相互作用するかを分析するための統一的なテストベッドを提供する拡散ベースの枠組みを提案します。
- 広範な実験により、合成データと実データには補完的な役割があることを示し、モーションのリアリティ、時間的整合性、アイデンティティ保持を高めるための合成サンプル選択の効率的な方法も提案します。
- 本研究はこの領域における合成データの役割を包括的に扱った最初の試みとして位置づけられ、データ効率と汎化性の高い生成モデル構築に向けた実践的な示唆を提供します。



