FUMO: 単一画像反射除去のための事前情報で調整された拡散

arXiv cs.CV / 2026/3/20

📰 ニュースTools & Practical UsageModels & Research

共有:

要点

FUMOは、拡散ベースの事前情報モジュレーションフレームワークを単一画像の反射除去のために導入し、明示的な事前情報が条件付けを導くことで、より良い空間的制御性と構造的忠実性を実現する。
本手法は混合画像から2つの事前情報を導出する。反射強度を推定するための強度の事前情報と、マルチスケール残差の集約を介して詳細感度の応答を捉える高周波の事前情報である。
粗い特徴から細部へと段階的な訓練戦略を採用し、第1段階では条件付き残差の注入をゲート化して、反射が支配的で構造に敏感な領域に焦点を当てる。続く第2段階では、局所的なアライメントのずれを補正し、ディテールをシャープ化するリファインメントネットワークを用いる。
標準ベンチマークおよび現実世界の難しい画像を用いた実験は、定量的な競争力ある結果と知覚品質の向上を示した。
著者は再現性と実用性を支援するため、GitHubにコードを公開している。

要旨：単一画像の反射除去（SIRR）は実世界のシーンで困難であり、反射の強さは空間的に変動し、反射パターンは透過構造と密接に絡み合っています。本論文は、空間的制御性と構造的忠実度を向上させるための明示的なガイダンス信号を導入するprior modulationフレームワーク（FUMO）を備えた拡散モデルを提案します。混合画像から直接抽出される2つのプリオリ情報は、空間的反射の重症度を推定する輝度プリオリと、多スケール残差集約を介してディテール感度の高い応答を捉える高周波プリオリです。私たちは粗から細へのトレーニングパラダイムを提案します。第一段階では、これらの手掛かりを組み合わせて条件付き残差注入をゲートし、条件付けを反射が支配的で構造に敏感な領域に集約します。第二段階では、精緻化ネットワークが局所的なずれを修正し、画像空間の微細なディテールをシャープにします。標準ベンチマークと現実世界の難しい画像の両方で行われた実験は、競争力のある定量的結果と一貫して改善された知覚品質を示します。コードは https://github.com/Lucious-Desmon/FUMO に公開されています。

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

日経XTECH

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

日経XTECH

文字起こしだけじゃない、要約から資料まで作る「AIボイスレコーダー」

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

Gmailで返信を自動作成、「Google AI Plus」で驚異の時短術

日経XTECH

FUMO: 単一画像反射除去のための事前情報で調整された拡散

要点

関連記事

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

文字起こしだけじゃない、要約から資料まで作る「AIボイスレコーダー」

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

Gmailで返信を自動作成、「Google AI Plus」で驚異の時短術

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer