SDD-YOLO:エッジ効率的展開による地上—航空(G2A)対UAV監視のための小型目標検出フレームワーク

arXiv cs.CV / 2026/3/27

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、地上から航空目線(G2A)で小型UAV(サブピクセル級)を検出するための専用フレームワーク「SDD-YOLO」を提案しています。
  • 4倍のダウンサンプリング解像度で動作するP2高解像度検出ヘッドにより、微小目標に必要な細かな空間情報をより確実に捉えるよう設計されています。
  • YOLO26のD F Lなし・NMSなしの推論向けアーキテクチャと、MuSGDのハイブリッド学習(ProgLoss、STAL)を組み合わせ、疎な小目標信号で起きやすい勾配の振動を抑制します。
  • 評価用に約3万枚の注釈画像からなるG2A向け大規模データセット「DroneSOD-30K」を構築し、SDD-YOLO-nはmAP@0.5で86.0%を達成してYOLOv5n比で+7.8pt改善しています。
  • 推論効率も高く、RTX 5090で226 FPS、Xeon CPUで35 FPSを示しており、エッジでのリアルタイム運用を見据えた性能が示唆されています。

概要: 地上から航空(G2A)視点での小型無人航空機(UAV)の検出は、画素占有率が極めて低いこと、乱雑な空中背景、そして厳しいリアルタイム制約といった重大な課題を伴います。既存のYOLOベースの検出器は主として一般的な物体検出向けに最適化されているため、サブピクセルの対象に対して十分な特徴解像度を欠いていることが多く、さらにデプロイ時の複雑さも増大します。本論文では、G2Aの対UAV監視のために設計した小標的検出フレームワークであるSDD-YOLOを提案します。微小標的にとって重要な、きめ細かな空間情報を捉えるために、SDD-YOLOは4倍のダウンサンプリングで動作するP2高解像度検出ヘッドを導入します。さらに、YOLO26の最新のアーキテクチャ上の改良を統合し、DFLフリーかつNMSフリーの構成によって推論を効率化します。また、ProgLossおよびSTALを用いるMuSGDハイブリッド学習戦略を取り入れることで、疎な小標的信号における勾配の振動を大幅に抑制します。評価を支えるために、約30,000枚の注釈付き画像から成る大規模なG2AデータセットであるDroneSOD-30Kを構築し、さまざまな気象条件をカバーします。実験の結果、SDD-YOLO-nはDroneSOD-30KにおいてmAP@0.5が86.0%を達成し、YOLOv5nのベースラインを7.8パーセントポイント上回ります。大規模な推論解析により、本モデルはNVIDIA RTX 5090で226 FPS、Intel Xeon CPUで35 FPSを示しており、将来のエッジデプロイに向けて卓越した効率性を実証しています。