リアルタイム小型UAV検出のためのデータ拡張最適化:軽量な文脈対応型アプローチ

arXiv cs.CV / 2026/4/23

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、軽量モデル(YOLOv11 Nanoなど)をエッジ端末で用いる前提で、小型UAVのリアルタイム視覚検出を扱っている。
  • Mosaic系の戦略とHSV色空間の適応を組み合わせた、軽量かつ文脈対応型のデータ拡張パイプラインを提案する。
  • 4つの標準データセットでの実験では、Copy-Pasteのような重い手法と比べて合成アーティファクトや過学習を抑えつつ、mAPを全シナリオで大きく改善することが示されている。
  • 霧条件下での一般化性能も評価し、提案手法がリアルタイムに必要な「精度」と「安定性」の最良のバランスを提供する一方、MixUpのような手法は特定の用途でのみ有効であることが分かった。

要旨: 無人航空機(UAV)の視覚検出は、小型という物理的特徴と環境上の課題のため、監視システムにおいて重要なタスクである。深層学習モデルは大きな進展を遂げているものの、それらをエッジデバイスに導入するには、学習能力が限られているYOLOv11 Nanoのような軽量モデルの使用が必要となる。本研究では、Mosaic戦略とHSV色空間の適応を組み合わせた、効率的で文脈を考慮したデータ拡張パイプラインを提案し、これらのモデルの性能を向上させる。4つの標準データセットに対する実験結果から、提案手法は、Copy-Pasteのような重い手法やインスタンス単位の手法と比較して、合成アーティファクトの生成や過学習を防ぐだけでなく、あらゆるシナリオにおいて平均適合率(mAP)を大幅に向上させることが示された。さらに、霧の条件下での一般化能力の評価では、提案手法は、リアルタイムシステムに対してPrecisionと安定性の最適なバランスを提供することが明らかになった。一方、MixUpのような代替手法は、特定の用途においてのみ有効である。