RawGen:カメラRAW画像生成の学習
arXiv cs.CV / 2026/4/2
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、テキストからカメラRAW画像(リニア、シーン参照)を生成し、さらにsRGBをカメラ固有のRAW表現へ逆変換するための、拡散(diffusion)ベースの枠組みRawGenを提案する。
- RawGenは、大規模なRAWデータセットを収集することが難しいという動機に基づく。既存のRAWデータセットは限られており、特定のカメラハードウェアや固定された画像信号処理(ISP)パイプラインに結び付いていることが多いためである。
- 写真のように仕上げられたsRGBではなく、物理的に意味のあるリニア出力を得るために、手法は潜在空間と画素空間の双方にまたがる特殊な処理を用いる。そして、複数のISP差分によって生じるsRGB表現を共通のシーン目標へと結び付ける、多対一の逆ISPデータセットで学習する。
- 著者らは、条件付きdenoiser(ノイズ除去器)と、ISPが未知で多様である状況により適切に対応するための専用decoderを微調整し、従来の逆ISPアプローチと比べて、カメラ中心のリニア復元の性能を高める。
- また、RawGenが、下流の低レベル視覚タスクに対してRAW復元そのもの以外にも役立つ、スケーラブルなテキスト駆動型の合成RAWデータを生成できることを報告している。



