HarmoniDiff-RS:衛星画像合成のための学習不要ディフュージョン調和

arXiv cs.CV / 2026/4/22

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • HarmoniDiff-RSは、リモートセンシングの用途で異なるドメイン条件下の合成衛星画像を調和させるための、学習不要の拡散ベースフレームワークです。
  • Latent Mean Shift操作により、ソースとターゲットの放射輝度特性を整合させ、画像の特性を転送しつつ合成の意味を保つことを狙います。
  • 調和と内容保持のバランスのために、Timestep-wise Latent Fusionを導入し、初期と後期の反転潜在表現を組み合わせて複数の候補合成を生成します。
  • 軽量な調和度(harmony)分類器を学習し、候補の中から最も整合的な結果を自動的に選択します。
  • fMoWから派生した新しいベンチマークデータセットRSIC-H(合成ペア500件)を構築し、再利用可能なコードも公開しています。

Abstract

衛星画像の合成(コンポジット)における画像統合は、データ拡張、災害シミュレーション、都市計画などのリモートセンシング応用において重要な役割を果たします。本研究では、さまざまなドメイン条件のもとで合成衛星画像を調和(ハーモナイズ)させるための、訓練不要の拡散(ディフュージョン)ベースフレームワークであるHarmoniDiff-RSを提案します。本手法は、ラジオメトリック特性をドメイン間で伝達するLatent Mean Shift(潜在平均シフト)操作によって、ソースドメインとターゲットドメインを整合させます。統合(調和)と内容保持のバランスを取るために、高い調和のための初期の反転潜在(inverted latents)と意味的一貫性のための後期の潜在を活用し、複数の合成候補を生成するTimestep-wise Latent Fusion(タイムステップごとの潜在融合)戦略を導入します。さらに、それらの中から最も首尾一貫した結果を自動的に選択するための軽量な調和分類器を学習させます。また、fMoWから派生した衛星画像調和のためのベンチマークデータセットRSIC-Hを構築し、500組のペアとなる合成サンプルを提供します。実験により、本手法が衛星画像の合成を効果的に実行できることが示されており、スケーラブルなリモートセンシングの合成・シミュレーション課題に対する強い可能性があることがわかりました。コードは以下で利用可能です: https://github.com/XiaoqiZhuang/HarmoniDiff-RS.