マルチソースリモートセンシング画像分類のための代表的スペクトル相関ネットワーク

arXiv cs.CV / 2026/5/1

💬 オピニオンDeveloper Stack & InfrastructureModels & Research

要点

  • 本論文は、ハイパースペクトル画像とSAR/LiDARデータを融合するマルチソース画像分類フレームワークRSCNetを提案し、スペクトル冗長性と異種ソース間の不均一性という課題に対処します。
  • Key Band Selection Module(KBSM)により、他ソースからのガイダンスを用いてHSIのタスクに関連するスペクトルバンドを適応的に選択し、冗長性を抑えるとともに、PCA型の次元圧縮で起きやすい情報損失を回避します。
  • Cross-source Adaptive Fusion Module(CAFM)は、ソース間の注意(attention)による重み付けとローカル・グローバル文脈の洗練(refinement)を組み合わせ、モダリティ間の特徴相互作用を強化します。
  • 3つの公開ベンチマークで、RSCNetは既存の最先端手法より高い性能を示しつつ、計算量は大幅に抑えられており、コードも公開されています。

Abstract

ハイパースペクトル画像(HSI)とSAR/LiDARデータは、土地被覆分類において相補的なスペクトル情報と構造情報を提供します。しかし、それらの効果的な融合は、主に2つの制約により依然として困難です。すなわち、高次元HSIにおけるスペクトル冗長性と、多ソースデータ間の不均質な特性です。そこで本研究では、上記の課題に対し、スペクトル選択と適応的な相互作用によって特化的に対処する、新しいマルチソース画像分類フレームワークである代表スペクトル相関ネットワーク(RSCNet)を提案します。本ネットワークは2つの主要コンポーネントを備えています。(1)Key Band Selection Module(KBSM):クロスソースのガイダンスのもとで、元のHSIからタスクに関連するスペクトル帯を適応的に選択し、冗長性を緩和するとともに、従来のPCAベースのスペクトル次元圧縮に伴う情報損失を軽減します。さらに、学習された帯サブセットは識別力の高いスペクトル構造を示し、識別的なセマンティック手がかりと整合することで、コンパクトでありながら表現力のある表現を促進します。(2)Cross-source Adaptive Fusion Module(CAFM):クロスソースの注意重み付けと局所-グローバルな文脈的洗練を行い、クロスソース間の特徴相互作用を強化します。3つの公開ベンチマークデータセットでの実験により、提案するRSCNetは、最先端手法と比べて優れた性能を達成しつつ、計算複雑性を大幅に低く保てることを示します。コードは https://github.com/oucailab/RSCNet で公開されています。