VQ-Jarvis:鋭い視覚と高速な思考を備えた、検索強化型ビデオ復元エージェント

arXiv cs.CV / 2026/3/25

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、固定されたパイプラインよりも現実世界の多様な劣化にうまく対処することを目的とした、検索強化型ビデオ復元エージェント「VQ-Jarvis」を提案する。
  • 「鋭い視覚」として、VSR-Compareを提示する。これは、大規模なペア動画強化データセットであり、比較ペア20K件を含み、7種類の劣化タイプと11種類の強化オペレータにまたがる。
  • VQ-Jarvisは、訓練済みの評価(judge)モデルおよび劣化認識(degradation-perception)モデルを用いて、候補となる復元結果間の微妙な品質差を見分け、エージェントの判断を導く。
  • 「高速な思考」では、扱いやすい動画には1ステップの検索を用い、より困難なケースには階層的な段階的グリーディ探索を組み合わせて、効率と精度のバランスを取る。
  • 論文中の実験結果は、VQ-Jarvisが複雑に劣化した動画において既存のビデオ復元手法よりも優れていることを示している。