CrossEarth-SAR: SAR中心の十億規模の地理空間基盤モデルによるドメイン汎化可能なセマンティックセグメンテーション
arXiv cs.CV / 2026/3/13
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- CrossEarth-SARは、SARセンサーおよび地域を横断するクロスドメインのセマンティックセグメンテーションを目的として設計された、物理ガイド付きのスパース・ミクスチャー・オブ・エキスパート(MoE)アーキテクチャに基づく十億規模のSARビジョン基盤モデルを提案します。
- 本研究では、公開および私有のSAR画像を組み合わせた大規模データセットCrossEarth-SAR-200Kを提供し、弱監督および完全監督ラベルを組み合わせて、スケーラブルな事前学習を実現します。
- 8つのドメインギャップにまたがる22のサブベンチマークからなるベンチマークスイートは、SAR画像におけるドメイン汎化セマンティックセグメンテーションの初の統一標準を確立します。
- 実験結果は、20のベンチマークで最先端の性能を示し、マルチギャップ転送の下で一部のタスクにおいてmIoUを10%以上向上させ、コード・ベンチマーク・データセットを公開する予定です。
合成開口レーダー(SAR)は、全球的かつ全天候の地球観測を可能にします。しかし、撮像機構の多様性により、センサーや地域間のドメインシフトがそのセマンティックな一般化を著しく妨げます。これに対処するため、私たちは CrossEarth-SAR を提案します。これは、物理的記述子を組み込んだ新しい物理ガイド付きスパース・ミクスチャー・オブ・エキスパーツ(MoE)アーキテクチャに基づく、十億規模の SAR ビジョン基盤モデルであり、クロスドメインのセマンティックセグメンテーションを明示的に設計しています。大規模な事前学習を促進するために、CrossEarth-SAR-200K を開発しました。これは公開および私有のSAR画像を統一する、弱監督および完全監督ラベルを組み合わせたデータセットです。さらに、8つの異なるドメインギャップにまたがる22のサブベンチマークを含むベンチマークスイートを導入し、SAR画像に対するドメイン汎化のセマンティックセグメンテーションの初の統一標準を確立します。広範な実験は、CrossEarth-SAR が20のベンチマークで最先端の結果を達成し、マルチギャップ転送の下で一部のタスクにおいて従来法を超える10%以上のmIoU向上を示すことを実証しています。すべてのコード、ベンチマーク、およびデータセットは公開される予定です。




