要旨: スペクトルリモートセンシングにおける Domain Generalization Semantic Segmentation (DGSS) は、多様な取得条件におけるスペクトルシフトにより深刻な課題に直面しており、未知ドメインにデプロイされたモデルの性能が著しく低下します。基盤モデルに対する Parameter-Efficient Fine-Tuning (PEFT) は有望な方向性ですが、既存の手法はグローバルで均一な調整を用いています。この「ワンサイズ・フィット・オール」チューニングは、土地被覆の空間的異質性に対応できず、セマンティックな混乱を招きます。堅牢なDGSSの鍵は、単一のグローバル適応にあるのではなく、基盤モデルの特徴を細粒度で空間的に適応した精緻化を行うことにあると主張します。これを実現するために、DGSSの新規PEFTフレームワークSpectralMoEを提案します。SpectralMoEはMixture-of-Experts (MoE) アーキテクチャを用いて基盤モデルの特徴に局所的かつ精密な改良を行い、スペクトルリモートセンシング画像の選択されたRGBバンドから推定される深度特徴を取り入れて微調整プロセスを導くものです。具体的には、SpectralMoEは二重ゲート付きMoEアーキテクチャを採用し、視覚特徴と深度特徴を独立に上位k個の選択された専門家へルーティングして専門的な改良を行い、モダリティ別の調整を可能にします。その後のクロスアテンション機構が、洗練された構造的手掛かりを視覚ストリームに慎重に統合し、スペクトル変動によって生じるセマンティックな曖昧さを軽減します。広範な実験により、SpectralMoEはハイパースペクトル、マルチスペクトル、RGBリモートセンシング画像の複数のDGSSベンチマークで新たな最先端を確立することを示します。
局所的な高精度微調整:スペクトルシフトに対する基盤モデルの一般化を強化するデュアルゲート型 Mixture-of-Experts
arXiv cs.CV / 2026/3/17
📰 ニュースModels & Research
要点
- SpectralMoEは、デュアルゲート型Mixture-of-Expertsを用いて、スペクトルリモートセンシングにおけるドメイン一般化のための基盤モデル特徴の局所的で空間適応的なリファインメントを実行する、パラメータ効率の良いファインチューニングフレームワークである。
- 視覚特徴と深度特徴をモダリティ固有の方法で上位k個のエキスパートへ割り当て、RGBバンド由来の深度推定を指針としてリファインメントを調整する。
- その後、クロスアテンション機構が整えられた構造的手掛かりを視覚ストリームへ再統合させ、スペクトルシフトによって生じる意味的混乱を軽減する。
- 広範な実験により、ハイパースペクトル、マルチスペクトル、RGB画像を横断する複数のDGSSベンチマークで最先端の成績を達成し、未見ドメインへの頑健性を強調している。


![[ニューラルネットワーク] 今こそ起源を見つめる時 Ep.5 (最終話) 〜情熱の連鎖が明日を照らす〜](/_next/image?url=https%3A%2F%2Fassets.st-note.com%2Fproduction%2Fuploads%2Fimages%2F260885500%2Frectangle_large_type_2_f8df7c72d21f86c39d4096dd995f50d1.png%3Fwidth%3D219%26dpr%3D2%26frame%3D1%26format%3Djpg&w=3840&q=75)
