画像の影除去におけるCVPR2026 NTIREチャレンジ優勝:セマンティックおよび幾何学的ガイダンスによるカスケード精錬を介した影除去

arXiv cs.CV / 2026/4/20

📰 ニュースIndustry & Market MovesModels & Research

要点

  • 本論文は、CVPR 2026 NTIRE WSRD+チャレンジ向けに、OmniSRを基盤とした3段階の進歩的(プロ)影除去パイプラインを提案しており、脱影を反復的な直接精錬として定式化しています。
  • RGBの見え(appearance)に加え、凍結したDINOv2のセマンティック・ガイダンスと、単眼深度および表面法線から得る幾何学的手がかりを組み合わせ、これらのガイダンスを全段で再利用します。
  • 多段カスケードの最適化を安定化するため、各段を通じて再構成誤差が増えないことを促す収縮制約付き目的関数を導入しています。
  • 学習は、WSRDの事前学習からWSRD+の教師ありへ段階的に転移し、その後WSRD+ 2026への最終適応と、コサインアニーリングによるチェックポイント・アンサンブルを行います。
  • 公式のWSRD+ 2026の隠しテストセットでは、最終アンサンブルが総合1位の成績となり、NTIRE 2026 Image Shadow Removal Challengeを受賞し、ISTD+およびUAV-SC+でも高い性能が確認されています。

要旨: 本稿では、CVPR2026 NTIRE WSRD+ チャレンジ向けの、3段階の漸進的影除去(progressive shadow-removal)パイプラインを提案する。OmniSR に基づく本手法では、脱影を反復的な直接リファインメントとして扱い、後段が前段の予測によって残された残留アーティファクトを修正する。モデルは、RGBの見え(appearance)に加えて、凍結したDINOv2のセマンティック誘導(semantic guidance)と、単眼深度および表面法線(surface normals)から得られる幾何学的手がかり(geometric cues)を組み合わせる。これらは全段で共通して再利用される。多段階の最適化を安定化するために、カスケード全体で再構成誤差が減少し続けることを促す、収縮制約付き目的関数(contraction-constrained objective)を導入する。学習は、段階的なトレーニングパイプラインにより、初期のWSRD事前学習からWSRD+の教師あり学習へと移行し、さらにコサインでアニーリングしたチェックポイントのアンサンブル(cosine-annealed checkpoint ensembling)によって最終的にWSRD+ 2026へ適応させる。公式のWSRD+ 2026の非公開テストセットにおいて、最終アンサンブルは 26.680 PSNR、0.8740 SSIM、0.0578 LPIPS、26.135 FID を達成し、総合1位となり、NTIRE 2026 Image Shadow Removal Challenge を受賞した。提案モデルの高い性能は、ISTD+ および UAV-SC+ データセット上でもさらに検証されている。