DB SwinT:光学リモートセンシング画像における道路抽出のためのデュアルブランチSwin Transformerネットワーク
arXiv cs.CV / 2026/3/26
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、複雑な遮蔽下でも光学リモートセンシング画像からの道路抽出を改善するための、デュアルブランチSwin Transformerネットワーク「DB SwinT」を提案する。
- Swin Transformerによる長距離依存関係のモデリングと、U-Net型のマルチスケール特徴融合パイプラインを組み合わせることで、細かな道路構造とネットワーク全体の連続性の双方をより良く復元する。
- デュアルブランチエンコーダは、局所表現(遮蔽領域における微細な詳細)とグローバル表現(より広い意味的文脈)を補完的に学習し、分断された道路出力の課題に対処する。
- Attentional Feature Fusion(AFF)モジュールにより、2つのブランチを適応的に融合して、遮蔽された道路区間の検出を強化する。
- マサチューセッツ州およびDeepGlobeでの実験では、それぞれIoUスコアが79.35%および74.84%となり、リモートセンシングにおける道路抽出の性能向上を示している。