ReLeaf:ドメインと種をまたいだ葉のセグメンテーションのベンチマーク

arXiv cs.CV / 2026/5/6

📰 ニュースSignals & Early TrendsModels & Research

要点

  • 本論文は、個別化された自動の植物処理に不可欠な「葉レベルの精密セグメンテーション」が、種を十分にカバーしないデータセットや、最新のインスタンスセグメンテーション手法を体系的に評価する枠組み不足のために十分に進んでいない点を指摘しています。
  • 葉のセグメンテーションに関する既存データセットを調査し、その中から4つの公開データセットを選定したうえで、1段・2段およびTransformerベースの検出器を比較し、実運用でのトレードオフが最も良いものとしてYOLO26の特定構成を推奨しています。
  • 種や撮影条件(収録セットアップ)を跨ぐと性能が大きく低下し、とくに「実験室データのみで学習したモデル」で落ち込みが顕著であることを、クロスドメイン実験で示しています。
  • データ整備のため、23種の植物について葉レベルのマスクを提供する新しいベンチマークを導入し、CropAndWeed画像の一部を用いた準自動アノテーションで作成したとしています。
  • 既存4データセットすべてで学習したモデルは、各テストセットで平均mAP50-95が83.9%、新ベンチマークでは40.2% mAPを達成し、多様な葉セグメンテーションデータセットの重要性を浮き彫りにしています。

Abstract

世界的な食料需要の増加と、気候による圧力の高まりは、持続可能で精密な農業実践の必要性を強めています。自動化された個別の植物処理は、きめ細かな視覚解析に依存していますが、作物の健康状態、成長ダイナミクス、収量の可能性、局所的なストレス症状の評価に価値があるにもかかわらず、葉レベルのセグメンテーションは十分に研究されていません。この進展の制約は、特に種のカバレッジに関して専用データセットが不足していること、そしてこの課題に対する最新のインスタンスセグメンテーション手法アーキテクチャの体系的な評価が存在しないことにあります。本研究では、これらのギャップを埋めるために、現行のデータを調査し、利用可能な4つの適切な公開葉セグメンテーションデータセットを特定します。これらを用いて、1段階・2段階およびTransformerベースの検出器を比較し、現実の精密農業タスクに対して最良のトレードオフを提供するYOLO26モデルの構成を見出します。広範なドメイン横断の一般化実験では、特に実験室データのみで学習したモデルにおいて、植物種や記録セットアップ間で大幅な性能低下が生じることが明らかになりました。データ利用可能性を高めるために、選定したCropAndWeed画像に対する半自動アノテーションによって作成した、23の植物種の葉レベルマスクを含む新しいベンチマークデータセットを提案します。既存の4つすべてのデータセットで学習したモデルは、それぞれ対応するテストセット上で平均mAP50-95が83.9%となり、さらに新しいベンチマーク上では40.2%を達成し、一般化の改善を示すとともに、頑健な精密農業のためには多様な葉セグメンテーションデータセットが必要であることを強調しています。