Ghost Convolution と注意機構を組み込んだ YOLOv8 によるインテリジェント交通システム向けリアルタイム車両検出

arXiv cs.CV / 2026/4/28

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • 本論文は、Ghost Module、CBAM(注意機構)、DCNv2(変形畳み込み)をYOLOv8nに組み合わせることで、交通シーンの複雑さや幾何学的なばらつきに対処しつつリアルタイム車両検出を高精度化する改良モデルを提案している。
  • Ghost Moduleは効率的な特徴生成により特徴の冗長性を抑え、CBAMはチャネル注意および空間注意によって特徴表現の質を高める。
  • DCNv2により、車両の形状や構造の変形に対する適応性を高め、複雑な環境でも頑健性の向上を狙っている。
  • KITTIデータセットで、提案モデルはmAP@0.5で95.4%を達成し、ベースラインのYOLOv8nに対して8.97%の改善とされている(精度96.2%、再現率93.7%、F1スコア94.93%)。
  • 7つの最先端検出器との比較実験とアブレーション研究により、統合した各モジュールが主要指標を一貫して改善し、それぞれの寄与と組み合わせ効果が確認された。

Abstract

正確な車両検出は、自動運転、交通監視、および知的交通システムの重要な構成要素である。本論文では、検出性能を向上させるためにGhost Module、Convolutional Block Attention Module(CBAM)、Deformable Convolutional Networks v2(DCNv2)を統合した改良YOLOv8nベースのモデルを提案する。Ghost Moduleは効率的な特徴生成により特徴の冗長性を低減し、CBAMはチャネルおよび空間の注意(attention)を通じて特徴表現を洗練させ、DCNv2は車両構造における幾何学的な変動への適応性を高める。KITTIデータセットで評価したところ、提案モデルは95.4%のmAP@0.5を達成し、基準となるYOLOv8nに対して8.97%の改善を示した。さらに、96.2%の適合率、93.7%の再現率、および94.93%のF1スコアも得られている。7つの最先端検出器との比較分析では、主要な性能指標において一貫して優位性が示され、アブレーション研究により統合された各モジュールの個別および組み合わせによる寄与が検証される。特徴の冗長性、注意による洗練、空間適応性に対処することで、提案手法は多様で複雑な交通環境における車両検出に対し、堅牢で計算効率の高い解決策を提供する。