COTONET: 成長段階の綿花莢検出のための YOLO11 ベースのカスタム検出アルゴリズム

arXiv cs.CV / 2026/3/13

📰 ニュースTools & Practical UsageModels & Research

要点

  • COTONETは、異なる成長段階の莢を識別するために、アテンション機構を組み込んだYOLO11ベースのカスタム綿花莢検出器です。
  • アーキテクチャは標準の畳み込みをSqueeze-and-Excitationブロックに置換し、アテンション対応のバックボーンを導入し、アップサンプリングにはCARAFEを使用し、ネックパスにはSimAMとPHAMを組み込み、マルチレベルのアテンションを実現します。
  • 低リソースのエッジコンピューティングおよびモバイルロボティクス向けに設計され、パラメータ数は7.6M、計算量は27.8 GFLOPSです。
  • このモデルは標準のYOLOベースラインを上回り、綿花莢検出タスクでmAP50が81.1%、mAP50-95が60.6%を達成します。
要旨: 綿花の収穫は、綿花莢が物理的に操作され、繊維の劣化を招く可能性がある重要な段階です。最高品質を保つには、繊維の固有の特性を保持するよう、丁寧な手動の把持を模倣する収穫方法が必要です。この過程を自動化するには、さまざまな生育段階における綿花莢を識別できるシステムが必要です。この課題に対処するため、難しいケースの検出を改善するように設計された注意機構を備えた強化型のカスタム YOLO11モデルである COTONET を提案します。アーキテクチャは、学習不能な操作に勾配を取り入れることで、形状と特徴抽出を強化します。主なアーキテクチャの変更点には、畳み込みブロックをSqueeze-and-Excitationブロックに置換すること、注意機構を組み込んだ再設計のバックボーン、標準のアップサンプリング操作をContent Aware Reassembly of Features(CARAFE)に置換することが含まれます。さらに、主要な特徴の集約にはSimple Attention Modules(SimAM)を、下向きのネックパスにおけるチャネル・空間・座標方向のアテンションにはPHAM(Parallel Hybrid Attention Mechanisms)を統合します。この構成は、綿花作物の成長の複雑さを解釈する際の柔軟性と頑健性を高めます。COTONETは7.6Mパラメータと27.8 GFLOPSを活用する小〜中規模のYOLOモデルに合わせて設計されており、低リソースのエッジコンピューティングおよびモバイルロボティクスに適しています。COTONETは標準のYOLOベースラインを上回り、mAP50が81.1%、mAP50-95が60.6%を達成します。