PASDiff:実世界の低照度における顔の強調と復元のための物理に配慮したセマンティック・ガイダンス

arXiv cs.CV / 2026/3/27

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、低照度、ぼけ、ノイズ、視認性の低下といった実世界の劣化条件のもとで、低照度の顔の強調と復元を共同で行うための、物理に配慮したセマンティック・ディフュージョンモデルPASDiffを提案する。
  • PASDiffは、逆強度重み付けとRetinex理論に基づくフォトメトリック制約を用いることで、学習不要のアプローチにより自然な照明と色の性質(クロマティシティ)をもっともらしく復元する。
  • さらに、オフ・ザ・シェルフの顔面プライヤから顔の構造を抽出し、フォトメトリックなバイアスを抑制するStyle-Agnostic Structural Injection(SASI)機構を追加し、アイデンティティの保持を改善することを目指す。
  • 著者らはまた、複雑な低照度の顔画像700枚からなる新しいベンチマークデータセットWildDark-Faceを構築し、現実的な条件での性能評価を行う。
  • 実験結果は、PASDiffが既存手法よりも優れており、自然な照明・色の復元と、より強いアイデンティティの一貫性とのバランスを実現していることを示している。

要旨: 実環境の低照度下で撮影された顔画像は、低照度、ぼ blur、ノイズ、低い可視性など、複数の劣化を受けます。既存のカスケード型ソリューションはしばしば深刻な誤差蓄積に悩まされ、一方で一般的なジョイントモデルは明示的な顔の事前知識を欠き、明瞭な顔構造を復元するのが難しいです。本論文では、学習不要の手法である、物理情報を意識したセマンティック拡散(PASDiff)を提案します。もっともらしい照明と色分布を実現するために、逆強度重み付けとレティネックス理論を活用してフォトメトリック制約を導入し、それにより可視性と自然なクロマティシティを確実に回復します。顔の細部を忠実に再構成するために、我々のスタイル非依存構造注入(SASI)は、汎用の顔事前モデルから構造を抽出し、その固有のフォトメトリックバイアスを除去することで、アイデンティティ特徴と物理制約をシームレスに調和させます。さらに、複雑な劣化を伴う実環境の低照度顔画像700枚からなるベンチマークであるWildDark-Faceを構築しました。大規模な実験により、PASDiffが既存手法を大幅に上回り、自然な照明、色回復、アイデンティティ整合性の間で優れたバランスを達成することが示されます。