フローマッチングによる統一型、数指定不要のテキストからの動作生成
arXiv cs.CV / 2026/3/31
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、固定されたエージェント数を必要とせずに、テキストから複数人の動作を生成するためのUnified Motion Flow(UMF)を提案し、既存の動作生成器における汎化性能の低さに対処する。
- UMFは課題を、単一パスで動作の事前生成を行う段階(P-Flow)と、複数パスで反応生成を行う段階に分割し、効率を高めるとともに再帰的な誤差の蓄積を抑えることを目指す。
- P-Flowは、異なるノイズレベルに条件付けられた階層的な解像度を用いることで計算オーバーヘッドを低減しつつ、動作データ全体にまたがる強力な事前知識(プライヤ)を学習する。
- S-Flowは、反応変換とコンテキスト再構成のための共同確率的な経路を学習し、著者らはこれにより反復パス間での誤差の緩和に役立つと主張している。
- 実験およびユーザースタディにより、UMFが複数人の動作生成におけるテキストからの「ゼネラリスト」として有効であることが示され、プロジェクトページには追加資料が掲載されている。




