要旨: 本論文は、密集した農業環境におけるカモフラージュされた雑草の検出に特化して設計された、バイモーダルなエンドツーエンド・クロススペクトル・ネットワークであるSWNetを提示する。侵入種が主要作物の表現型の特徴を模倣する、同質色的ブレンド(homochromatic blending)によって特徴づけられる植物の擬態(カモフラージュ)は、従来のコンピュータビジョン・システムにとって大きな課題である。これらの制約を克服するために、SWNetは、遠距離の依存関係を捉えるためのPyramid Vision Transformer v2バックボーンと、可視光および近赤外情報を動的に統合するBimodal Gated Fusion Moduleを用いる。NIRスペクトルで捉えられるクロロフィルの反射における生理学的な差異を活用することで、提案アーキテクチャは、可視領域だけでは区別できない対象を効果的に識別する。さらに、エッジ認識に配慮したRefinementモジュールを用いて、よりシャープな物体境界を生成し、構造上の曖昧さを低減する。Weeds-Bananaデータセットでの実験結果は、SWNetが10の最先端手法を上回ることを示している。本研究は、クロススペクトルデータの統合と境界に導かれたリファインメントが、複雑な作物キャノピーにおける高いセグメンテーション精度に不可欠であることを示している。コードはGitHubで利用可能: https://cod-espol.github.io/SWNet/
SWNet:カモフラージュされた雑草を検出するためのクロススペクトル・ネットワーク
arXiv cs.CV / 2026/4/20
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- SWNetは、密な農業環境におけるカモフラージュされた雑草を検出するために設計されたバイモーダルのエンドツーエンド・クロススペクトル・ニューラルネットワークとして提案されました。
- Pyramid Vision Transformer v2 をバックボーンに用い、Visible(可視)とNear-Infrared(近赤外)情報を動的に統合する Bimodal Gated Fusion Module を組み合わせています。
- NIRスペクトルにおけるクロロフィル反射の生理学的な違いを活用することで、可視領域では見分けが難しい対象を識別できるとしています。
- Edge-Aware Refinement モジュールにより、境界をよりシャープにし、構造の曖昧さを減らしてセグメンテーション精度を高めています。
- Weeds-Banana データセットでSWNetが最先端手法10件を上回ったことが示され、GitHubでコードも公開されています。



