画像ベースのインゲン豆の葉の病害分類のための、リソース効率に優れたハイブリッドCNN-LSTMネットワーク

arXiv cs.CV / 2026/4/16

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、携帯可能なデバイスへの展開を想定してメモリ要件を削減しつつ診断精度の向上を目指す、軽量なハイブリッドCNN–LSTMアーキテクチャを提案している。
  • 1.86 MBという非常に小さなモデルフットプリントにより、分類精度94.38%を報告しており、従来のCNNベースのシステムに比べて約70%のサイズ削減に相当する。
  • 著者らは画像拡張戦略を評価し、汎用的な拡張の組み合わせよりも、診断パターンをより適切に保持するよう調整した拡張変換の方が有効であることを見いだしている。
  • iBeanデータセットでの実験により、最先端の性能を示し、EfficientNet-B7+LSTMバリアントではF1スコア99.22%を達成している。これにより、リソース制約のある環境でのリアルタイムな農業の意思決定支援が可能になる。
  • 本研究では、公的に利用可能なコードと拡張データセットをGitHubリポジトリを通じて提供し、再利用やさらなる研究を促進している。

概要: 正確でリソース効率の高い自動診断は、現代の農業エキスパートシステムの基盤です。畳み込みニューラルネットワーク(CNN)は植物病理分野においてベンチマークを確立している一方で、長距離の空間的依存関係を捉える能力は、標準的なプーリング層によってしばしば制限されており、また高いメモリ使用量がポータブル端末への展開を妨げています。本論文では、マメの葉の病気分類のための軽量なハイブリッドCNN-LSTMシステムを提案します。特徴マップ内の空間—時系列関係をモデル化するためにLSTM層を統合することで、提案するハイブリッドアーキテクチャは、メモリフットプリントを1.86 MBに保ちながら94.38%の精度を達成します。これは、従来のCNNベースのシステムに比べてサイズを70%削減したことに相当します。さらに本研究では、画像データ拡張戦略を体系的に評価し、診断パターンの完全性を維持する観点では、個別に調整された変換が、一般的な組み合わせよりも優れていることを示します。 extit{ibean}データセットでの結果により、提案システムがEfficientNet-B7+LSTMにおいて最先端のF1スコア99.22%を達成することが確認されました。これにより、リソース制約のある環境におけるリアルタイムの農業意思決定支援のための、堅牢で拡張可能な枠組みが提供されます。本研究で用いたコードおよび拡張データセットは、こちらの
pm{\href{https://github.com/HJin-R/bean_disease}{Github}}
リポジトリで公開されています。