広告

Tiny-ViT:効率的かつ説明可能なジャガイモ葉の病害分類のためのコンパクトなビジョントランスフォーマー

arXiv cs.CV / 2026/3/31

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、資源に制約のある環境でのジャガイモ葉の病害分類を効率的かつ説明可能に行うための、コンパクトなビジョントランスフォーマー「Tiny-ViT」を提案している。
  • Early Blight(早枯病)、Late Blight(疫病)、Healthy(健全)の3クラスを対象とし、画質を改善するための前処理としてリサイズ、CLAHE、ガウシアンブラーを含めている。
  • 報告されている性能は非常に高く、テスト精度99.85%、平均交差検証精度99.82%を達成し、DeiT Small、Swin Tiny、MobileViT XSといったベースラインモデルを上回っている。
  • Matthews相関係数(MCC)0.9990と非常に狭い信頼区間により、モデルは高い信頼性と汎化性能を示している。
  • 説明可能性はGRAD-CAMによって強化され、病変部位をハイライトする。計算コストが低いため、低遅延のリアルタイム推論に適したアプローチであるとしている。

要旨: 作物の健康を維持し、最大収量を確保するためには、特にジャガイモ作物において、植物の病害を早期かつ正確に特定することが重要です。早期疫病や後期疫病のようなジャガイモの葉の病気は農家にとって大きな課題となっており、しばしば収量の損失や殺虫剤(農薬)使用量の増加につながります。従来の検出手法は時間がかかるだけでなく、人為的な誤りの影響も受けるため、自動化され効率的な手法が必要とされています。本論文では、資源が限られたシステムでの利用を想定して開発された、小型で効果的なVision Transformer(ViT)であるTiny-ViTモデルを用いた、ジャガイモの葉の病害分類の新しい手法を提案します。このモデルは3クラス、すなわち早期疫病、後期疫病、健康な葉からなるデータセットで検証され、前処理手順としてリサイズ、CLAHE、ガウシアンブラーが行われます。これにより画像の品質が向上します。Tiny-ViTモデルのテスト精度は99.85%と非常に高く、平均CV精度は99.82%であり、DEIT Small、SWIN Tiny、MobileViT XSといったベースラインモデルよりも優れています。さらに、このモデルはMatthews相関係数(MCC)が0.9990であり、信頼区間(CI)が[0.9980, 0.9995]と狭いことから、高い信頼性と汎化性能が示されています。学習およびテスト時の推論時間は競争力があり、計算コストが低いため、リアルタイムアプリケーションへの適用が可能です。加えて、GRAD-CAMの助けにより、罹患部位を特定できるためモデルの解釈可能性も向上します。総合すると、提案するTiny-ViTは、植物の病害分類という課題に対して、高い頑健性、効率性、説明可能性を備えた解決策です。

広告