広告

プロトタイプベースの低高度UAVセマンティックセグメンテーション

arXiv cs.CV / 2026/4/3

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、低高度UAV画像向けに特化したプロトタイプベースのセマンティックセグメンテーション手法「PBSeg」を提案する。そこでは、スケール変動や細かな物体境界の扱いが、エッジデバイスの計算制約下で困難となる。
  • 特徴の冗長性を活用し、計算複雑性を低減しつつ、セグメンテーション品質の維持を目指すためのプロトタイプベースのクロスアテンション(PBCA)を導入する。
  • PBSegは、局所的な詳細と大域的な意味の両方を捉えるために、変形畳み込み(DConv)とコンテキスト認識型モジュレーション(CAM)を組み合わせた効率的なマルチスケール特徴抽出モジュールを用いる。
  • UAVidおよびUDD6での実験により、強い結果が示される。UAVidで71.86% mIoU、UDD6で80.92% mIoUを達成しており、効率を改善しつつ競争力のある精度を示す。
  • 著者らは実装コードをGitHubで公開しており、研究者や開発者がこの手法を再現し、発展させることを可能にしている。

Abstract

低高度UAV画像のセマンティックセグメンテーションは、極端なスケール変動、複雑な物体境界、そしてエッジデバイス上での限られた計算資源という独自の課題を有します。既存のトランスフォーマーベースのセグメンテーション手法は目覚ましい性能を達成していますが計算オーバーヘッドが大きい一方で、軽量アプローチは高解像度の航空シーンにおける微細な詳細を捉えるのが難しいという問題があります。これらの制限に対処するため、UAV用途に特化した効率的なプロトタイプベースのセグメンテーションフレームワークであるPBSegを提案します。PBSegは、セグメンテーション品質を維持しつつ計算複雑性を低減するために特徴の冗長性を活用する、新しいプロトタイプベースのクロスアテンション(PBCA)を導入します。さらに、本フレームワークは、局所的な詳細と大域的な意味の両方を捉えるために、変形畳み込み(DConv)とコンテキストに応じたモジュレーション(CAM)を組み合わせた効率的なマルチスケール特徴抽出モジュールを組み込みます。2つの困難なUAVデータセットでの実験により、提案アプローチの有効性が示されました。PBSegは、UAVidで71.86\% mIoU、UDD6で80.92\% mIoUを達成し、計算効率を維持しながら競争力のある性能を実現しています。コードは https://github.com/zhangda1018/PBSeg で利用可能です。

広告