制御可能な生成的ビデオ圧縮

arXiv cs.CV / 2026/4/9

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、知覚品質を重視するビデオ圧縮における「知覚的な現実味」と「信号忠実度」の一般的なトレードオフを調停することを目的に、制御可能な生成的ビデオ圧縮(CGVC: Controllable Generative Video Compression)を提案する。
  • CGVCは代表的なキーフレームを符号化し、それらを非キーフレーム生成のための構造的事前知識(構造プリア)として用いる。さらに、より細かな詳細、構造、意味論を保持するために、フレームごとの緻密な制御信号も符号化する。
  • 非キーフレームは、与えられたプリアによって導かれる、時間的整合性と内容整合性を強制する制御可能な生成的ビデオモデルにより再構成される。
  • 色の復元を改善するため、著者らは色類似性に基づいて適応的にキーフレームを選択する、色距離ガイド付きキーフレーム選択アルゴリズムを提案する。
  • 実験の結果、CGVCは、客観的な信号忠実度と知覚品質の両方の指標において、従来の知覚的ビデオ圧縮手法よりも優れていることが示される。