MetaSR:生成的超解像のためのコンテンツ適応型メタデータオーケストレーション
arXiv cs.AI / 2026/4/30
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、画像・動画の内容と劣化が多様に変化する現実的な状況における生成的超解像を扱い、セグメントごとに適したサイド情報が必要になる点を示しています。
- MetaSRとして、固定的な条件付けではなく、Diffusion Transformer(DiT)に基づいてタスクに関連するメタデータを適応的に選択・注入する手法を提案しています。
- MetaSRは、DiTのVAEとトランスフォーマーバックボーンを用いて異種メタデータを融合し、蒸留による効率化で1ステップの拡散推論を可能にします。
- 多様なコンテンツと劣化条件での実験により、参照手法に対して最大1.0 dBのPSNR改善と、同等品質で最大50%の伝送ビットレート削減を達成し、レート–歪み最適化(RDO)枠組みにより評価しています。



