精密農業における自動除草検出のための畳み込み型とトランスフォーマー型検出器の比較評価

arXiv cs.CV / 2026/5/5

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、精密農業における現実的な条件下での早期除草検出を目的に、CNNベースとトランスフォーマーベースの物体検出アーキテクチャを比較します。
  • CNN側としてはYOLOファミリーの新しい派生(YOLOv26-nano)、トランスフォーマー側としてはRT-DETRやRF-DETRなどの代表的手法を取り上げて評価します。
  • 実験はGROUNDBASED_WEEDデータセット上で行い、検出性能(精度、再現率、平均適合率など)に加えて計算効率(推論速度)も測定します。
  • 結果から、効率と文脈モデリングの間に明確なトレードオフが示されます。すなわち、CNN検出器は低計算コストで高い性能を得やすい一方、トランスフォーマー検出器はグローバルな文脈をより捉えられるものの、より高い計算資源を要します。
  • 本研究は、精密農業アプリケーションにおけるモデル選定のための実用的な判断基準を提供することを狙いとしています。

概要: 本論文は、現実的なシナリオにおける早期の雑草検出のための、畳み込み型およびトランスフォーマー型の物体検出アーキテクチャに関する比較評価を提示する。各パラダイムから代表的なモデルとして、YOLO系の近年の派生であるYOLOv26-nanoに加え、RTDETRやRF-DETRのようなトランスフォーマー型のアプローチを検討する。実験はGROUNDBASED_ WEEDデータセット上で実施し、精度(precision)、再現率(recall)、平均適合率(average precision)、推論速度(inference speed)といった指標を用いて、検出精度と計算効率の観点から性能を評価できるようにした。結果は、効率と文脈(コンテキスト)モデリングの間に明確なトレードオフがあることを示している。すなわち、CNNベースの検出器は、より低い計算コストで高い性能を達成する一方で、トランスフォーマー型のアプローチは、より高い計算資源要求の代わりに、より優れたグローバルな文脈の取り込みを提供する。これらの結果は、精密農業アプリケーションにおけるモデル選択のための実用的な基準を与える。