BurstGP:生成的プライアの活用によるバースト画像超解像の強化

arXiv cs.CV / 2026/4/28

📰 ニュースModels & Research

要点

  • バースト画像超解像(BISR)は複数の低解像度フレームの情報を統合して1枚の高解像度画像を作る手法ですが、従来法では複雑なテクスチャでうまくいかなかったり、過度な平滑化(オーバースムージング)を起こしがちです。
  • 本論文では、生成的な基盤モデルのプライアを取り入れつつ忠実度の低下を最小限に抑える拡散モデルベースのBISR手法としてBurstGPを提案します。
  • BurstGPはマルチフレーム対応の従来BISRに基づき、入力の劣化推定に応じて細部の生成量を制御する「劣化対応コンディショニング機構」を導入します。
  • さらに、生成的なマルチフレーム(動画)sRGBプライアを利用しながら、raw入力を扱いlRGB出力を得るための頑健なsRGB-to-lRGBインバータも提案しています。
  • 実験ではBurstGPが、定量面(MUSIQやLPIPSなどの知覚系指標)および定性面の両方で既存の最先端を上回り、とりわけ豊かなテクスチャや微細な構造の復元が得意であることを示しています。

要旨: バースト画像超解像(BISR)は、バースト内の複数の低解像度(LR)フレームから情報を集約することで、1枚の高解像度(HR)画像を構築することを目指している。バースト間の時間的冗長性と空間的な整合性に依存している。従来の手法は目覚ましい結果を達成しているものの、複雑なテクスチャに対しては苦手であり、また過度な平滑化(オーバースムージング)に陥りやすい。拡散モデル、特に高品質データで事前学習されたものは、画像・動画超解像において現実的な詳細を生成する驚くべき能力を示している。しかし、BISRにおけるその潜在力はほとんど調査されていないのが現状であり、既存のアプローチは通常、タスク固有の拡散モデルをスクラッチから学習し、単一フレームの再構成に基づいて動作している。本研究では、これらの課題を克服するために、近年の基盤モデルの生成的な事前知識(generative priors)を活用した、BISRのための新しい拡散ベース手法であるBurstGPを提案する。具体的には、従来のBISRアプローチの上にマルチフレーム対応の拡散モデルを構築し、忠実度の損失を最小限に抑えつつ画像品質を向上させる。さらに、(i) 入力に推定される劣化の程度に基づいて微細な詳細の生成を制御する、新しい劣化認識(degradation-aware)条件付けメカニズム、および (ii) 堅牢なsRGB-to-lRGBインバータを導入することで、raw入力とlRGB出力画像として動作しつつ、生成的なマルチフレーム(動画)sRGB事前知識を利用できるようにする。実験的に、BurstGPが既存の最先端手法を、定量的にも(特に知覚指標を含むMUSIQおよびLPIPSに関して)定性的にも上回ることを示す。特に提案手法は、より豊かなテクスチャやより細かな構造的詳細の復元に優れており、従来手法に対するBISRにおける動画事前知識の可能性を際立たせている。