要旨: 陸面温度(LST)の超解像は環境モニタリングに重要です。しかし、粗い熱観測は微細な構造を大きく過小にしか決定しないため、依然として困難が残っています。本論文では、極端な空間劣化下での超解像のための新しい枠組みである、Earth Foundation Model-guided Diffusion(EFDiff)を提案します。EFDiffはPrithvi-EO-2.0の地球基盤モデルを用いて、高解像度の多分光反射率を地理空間埋め込みへ符号化し、それをクロスアテンションによりノイズ除去ネットワークへ注入することで、強度に劣化した観測から微細な復元を導きます。知覚的なリアリティとピクセルレベルの忠実性の間で相補的なトレードオフを提供する、2つの変種(EFDiff-\epsilon および EFDiff-x_0)を検討します。242,416枚の、熱—反射の登録済みランサット・パッチから成る、地球規模で多様性のあるベンチマークを用いて、極端な32\timesスケール差のもとでEFDiffを評価します。その結果、EFDiffは一貫して基準手法を上回り、EFMによるクロスアテンションの条件付けは、HLSチャネルの連結よりも効果的であることが示されます。LSTの超解像の文脈でEFDiffを提示しますが、本枠組みは、事前学習済みの地理空間表現が生成的復元を導き得る、リモートセンシングの幅広い課題に広く適用可能です。
地球ファウンデーションモデルと拡散モデルの融合:地表面温度(LST)の超解像への応用
arXiv cs.CV / 2026/4/21
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文では、空間解像度が極端に劣化した観測からの地表面温度(LST)超解像を目的とした新しい枠組み「Earth Foundation Model-guided Diffusion(EFDiff)」を提案する。
- EFDiffはPrithvi-EO-2.0の地球ファウンデーションモデルを用い、高解像度のマルチスペクトル反射率を地理空間埋め込みとして符号化し、それをクロスアテンションで拡散のノイズ除去ネットワークへ注入することで、劣化観測からの細かな再構成を導く。
- EFDiff-εとEFDiff-x0という2つの派生手法を示し、それぞれ知覚的リアリティと画素レベルの忠実度の間で異なるトレードオフを提供する。
- 242,416枚のランドサット・サーマル/リフレクトランスの対応パッチからなる大規模なグローバルベンチマークで、32×の難しいスケールギャップ条件の下、EFDiffがベースラインを一貫して上回り、地球ファウンデーションモデルによるクロスアテンション条件付けは単純なチャネル連結より有効であることを示す。
- LST超解像の文脈で提示しているものの、事前学習された地理空間表現が生成的再構成を導けるリモートセンシング課題全般へ広く適用可能であると述べている。




