果樹園画像における頑健なリンゴ検出のための最新オブジェクト検出器の比較研究
arXiv cs.CV / 2026/4/14
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、照明変化、葉の繁雑さ、密集した果実クラスター、部分的な遮蔽といった困難な条件を考慮することで、果樹園画像における頑健な単一クラスのリンゴ検出を扱う。
- 公開データセットであるAppleBBCH81に対し、固定の訓練/検証/テスト分割と、6つの検出器(YOLOv10n、YOLO11n、RT-DETR-L、Faster R-CNN、FCOS、SSDLite320)に共通する統一評価プロトコルを用いた、制御された再現可能なベンチマークを導入する。
- COCO形式の指標(mAP@0.5 および mAP@0.5:0.95)を用いると、YOLO11nは検証分割における厳密なローカライゼーションで最も高い性能を示す(mAP@0.5:0.95 = 0.6065;mAP@0.5 = 0.9620)。
- さらに、本研究はデプロイにおいて閾値に依存した挙動が重要であることも示す。低い信頼度の動作点(confidence >= 0.05)では、YOLOv10nが最も高いF1スコアを達成する一方で、RT-DETR-Lは再現率は高いものの偽陽性が多く、精度は低い。
- 全体として、結果は、検出器の選定をローカライゼーション精度だけでなく、計数、収量予測、ロボットによる収穫といった下流要件に合わせた閾値頑健性の観点からも行うことを推奨する。

