FlowAnchor：反転不要のビデオ編集における編集シグナルを安定化する手法

arXiv cs.CV / 2026/4/27

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

FlowAnchorは、編集シグナルでサンプリング軌跡を直接誘導することで、安定かつ効率的な「反転不要」のフローベース・ビデオ編集を実現するトレーニング不要のフレームワークです。
この手法は、既存の反転不要ビデオ編集がマルチオブジェクト場面やフレーム数増加で失敗しがちな点を、空間の局所化の不正確さや長さに伴うマグニチュード減衰に起因する高次元ビデオ潜在空間での編集シグナル不安定性にあると特定します。
FlowAnchorは、「どこを編集するか」と「どれくらい強く編集するか」の両方を明示的にアンカーし、編集中のガイダンスを安定化させます。
空間領域とテキストガイダンスの整合性を一貫させるSpatial-aware Attention Refinementと、長さの影響下でも編集の強さを十分に保つAdaptive Magnitude Modulationを組み合わせます。
実験では、FlowAnchorが特にマルチオブジェクトや高速運動のシーンで、より忠実で時間的に一貫した編集結果を、計算効率も高めて実現することが示されています。

要旨: 本論文では、安定かつ効率的な、反転不要かつフロー（流れ）ベースの動画編集のための、学習不要（training-free）フレームワークであるFlowAnchorを提案する。反転不要の編集手法は、編集信号によってサンプリング軌跡を直接誘導することで、画像において優れた効率と構造の保持を示してきた。しかし、このパラダイムを動画へ拡張することは依然として困難であり、多オブジェクトのシーンやフレーム数の増加に対して失敗することが多い。これらの根本原因を、ハイディメンションな動画潜在空間における編集信号の不安定性にあると特定する。この不安定性は、空間的な位置特定が不正確であることと、長さに起因する大きさの減衰が生じることから生じる。この課題を克服するために、FlowAnchorは「どこを編集するか」と「どれほど強く編集するか」の両方を明示的にアンカー（固定）する。具体的には、Spatial-aware Attention Refinement（空間を意識した注意の洗練）を導入し、テキストによる指示と空間領域との整合性を一貫して強制する。また、Adaptive Magnitude Modulation（適応的な大きさの変調）により、十分な編集強度を適応的に維持する。これらの仕組みにより編集信号が安定化され、望ましいターゲット分布へ向けたフローに基づく進化が導かれる。大規模な実験により、FlowAnchorが、困難な多オブジェクトおよび高速運動のシナリオにおいて、より忠実で時間的に一貫した、かつ計算効率の高い動画編集を達成することを示す。プロジェクトページは https://cuc-mipg.github.io/FlowAnchor.github.io/ で利用可能である。