DenseSwinV2:チャネル注意型デュアルブランチCNNトランスフォーマ学習によるキャッサバ葉病害分類
arXiv cs.AI / 2026/3/30
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、DenseNetスタイルの密な局所特徴学習と、カスタマイズしたSwin Transformer V2によるグローバル文脈モデリングを組み合わせた、ハイブリッド2分岐のCNN–Transformerフレームワーク「DenseSwinV2」を提案し、キャッサバ葉病害の分類を行う。
- シフト付きウィンドウの自己注意を用いて、視覚的に類似した病変の識別に役立つ長距離依存関係を捉え、遮蔽、ノイズ、複雑な背景といった課題に対処する。
- 各ストリームに対して独立したチャネル圧縮(squeeze)注意モジュールを適用し、疾患に関連する識別的な応答を強調し、冗長な活性や背景由来の活性を抑制する。
- 公開キャッサバデータセット(正常を含む5条件で31,000枚の画像)において、DenseSwinV2は分類精度98.02%、F1スコア97.81%を報告し、既存のCNNおよびトランスフォーマのベースラインを上回る。
- 結果は、本手法が画像品質が変動する圃場レベルの農業診断において、堅牢で実用的であることを示唆している。



