RPBA-Net:RAWドメインISP向けの解釈可能な残差ピラミッド両側アフィンネットワーク

arXiv cs.CV / 2026/5/6

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、RAWドメインでのデモザイシング、色補正、ディテール強調といったISPタスクを改善しつつ、モジュールの分断を抑えることを目的に、解釈可能なRPBA-Netを提案している。
  • RPBA-Netはpacked RAWを入力として、ベースRGB表現を推定し、identityに導かれる残差アフィン補正を学習することで、残差アフィンのベース再構成を行い、デモザイシングと強調を統一する。
  • pyramid両側アフィン格子に加え、ガイド駆動の自己回帰的な適応スライシングと、適応的なクロスレイヤ融合を組み合わせることで、階層的に大域的なトーン復元と局所的なテクスチャ強調をモデル化する。
  • スムーズネス、クロススケール整合性、マグニチュード正則化の各項を導入し、学習の安定性、制御性、そして構造的な解釈可能性を高めている。
  • 実験では、RPBA-Netが代表的なRAW-to-SRGB手法を上回り、復元忠実度と知覚品質で最先端の性能を示しつつ、モデルの複雑さを抑えてモバイル・組込み向けの展開可能性も維持している。