要旨: 低高度環境における無人航空機(UAV)の検出は、知覚・防衛システムにとって不可欠ですが、複雑な背景、カモフラージュ、マルチモーダル干渉のため、依然として高度に困難です。現実世界のシナリオでは、UAVは周囲の建物、植生、送電線などの構造物と視覚的に混ざり合うことが多く、コントラストの低下、境界の弱さ、雑然とした背景のテクスチャとの強い混同を招く。既存のUAV検出データセットは多様であるものの、これらのカモフラージュと複雑な背景の課題を特に捉えるようには設計されておらず、堅牢な実世界知覚の実現に向けた進展を制限している。このギャップを埋めるために、我々はUAV-CBを構築した。これは複雑な低高度背景とカモフラージュ特性を強調するよう意図的に精選された新しいRGB-T UAV検出データセットである。さらに、局所的な周波数空間で特徴をモデリングするLocal Frequency Bridge Network(LFBNet)を提案する。これはRGB-T融合における周波数-空間融合のギャップと、モダリティ間の不整合ギャップの双方を橋渡しする。UAV-CBおよび公開ベンチマークに関する広範な実験は、LFBNetが最先端の検出性能を達成し、カモフラージュや雑然とした条件下で高い頑健性を示すことを示しており、実世界のアプリケーションにおける周波数を意識したマルチモーダルUAV知覚への新たな視点を提供する。
UAV-CB: 複雑背景を持つRGB-TデータセットとUAV検出の局所周波数ブリッジネットワーク
arXiv cs.CV / 2026/3/19
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、複雑な低高度背景とカモフラージュを強調するように作成された新しいRGB-T UAV検出データセット「UAV-CB」を紹介する。
- また、局所周波数空間で特徴をモデル化し、RGB-T融合における周波数-空間統合のギャップとクロスモダリティの差異ギャップの双方を橋渡しする局所周波数ブリッジネットワーク(LFBNet)を提案する。
- UAV-CBおよび公開ベンチマークに関する広範な実験は、LFBNetが最先端の検出性能とカモフラージュおよび雑然とした条件下での堅牢性を達成することを示している。
- 本研究は、周波数を意識したマルチモーダル知覚アプローチを強調しており、現実世界のUAV検出を認識・防衛用途の改善につながる可能性がある。