AI Navigate

動画生成ポリシーのドラフト・ターゲット・サンプリング

arXiv cs.CV / 2026/3/17

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、Draft-and-Target Sampling と呼ばれるトレーニング不要の拡散推論パラダイムを提案し、動画生成ポリシーの効率を向上させる。
  • 補完的な2つの軌道を備えた自己対戦型デノイジング手法を導入する:高速なグローバル軌道生成のためのドラフトサンプリングと、小さなステップでの改良のためのターゲットサンプリング。
  • 冗長な計算を削減するためにトークンのチャンク化と漸進的受け入れ戦略を用いて速度向上をさらに実現し、3つのベンチマークで最大2.1倍のスピードアップを達成した。
  • 結果は成功率への影響を最小限に抑えつつ効率が向上することを示し、著者らはコードを公開している。

要約: ビデオ生成モデルは、タスクの説明と観測に条件付けてタスクを実行する際の将来状態を予測するロボット方針として用いられてきました。従来の研究は高い計算コストと長い推論時間を無視してきました。 この課題に対処するため、Draft-and-Target Sampling(ドラフト・アンド・ターゲット・サンプリング)を提案します。これは訓練不要のビデオ生成ポリシー向けの新しい拡散推論パラダイムで、推論効率を改善できます。私たちは一つのモデルで二つの補完的なデノイジング軌道を利用する自己対戦デノイジングアプローチを導入します。ドラフトサンプリングは大きなステップを取り、グローバルな軌道を高速に生成します。ターゲットサンプリングは小さなステップを取り、それを検証します。さらに生成を高速化するために、冗長な計算を削減するトークンチャンク化と漸進的受理戦略を導入します。三つのベンチマークの実験は、我々の手法が最大で2.1倍のスピードアップを達成し、成功率への影響を最小限に抑えつつ現在の最先端手法の効率を改善できることを示しています。コードは公開されています。