StomaD2:拡散ベースの復元検出ネットワークによる知的気孔表現型解析のオールインワンシステム

arXiv cs.CV / 2026/4/22

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • StomaD2は、破壊的なサンプリングや手作業の注釈に頼らずに、正確かつ高スループットな非侵襲の気孔表現型解析を実現するオールインワンの枠組みです。
  • システムは、劣化画像を復元する拡散ベースの復元モジュールと、気孔の小ささ・密集・混雑した見え方に合わせて設計された回転物体検出ネットワークを組み合わせています。
  • 改善点として、列方向の構造によるグローバル特徴の相互作用、マルチスケール整合性を高める文脈対応のリサンプリングと再重み付け、複雑な背景に対する判別力を高める特徴再構成モジュールが挙げられます。
  • 公開のMaizeおよびWheatデータセットでStomaD2は精度0.994/0.992を報告し、Oriented FormerやYOLOv12を含む10の先進ベースラインに対してF1-score/mAPが0.989と上位性能を示しました。
  • 本フレームワークは、8種類の気孔表現型を高速に抽出できるフィールド運用向けシステムとして統合され、130種以上の植物で検証されており、大規模な植物生理解析や精密農業に資する可能性が示されています。

要旨: 気孔は、植物の生理学的プロセスを調節し、環境応答を反映するうえで重要な役割を果たします。しかし、従来の手法は破壊的なサンプリングと手作業による注釈に依存しているため、大規模かつフィールドでの展開を制限されます。その結果、正確かつ高スループットな気孔フェノタイピングは依然として困難です。これらの制約を克服するために、非侵襲的な復元・検出統合フレームワークであるStomaD2が開発され、複雑な撮像条件下でも正確かつ高速な気孔フェノタイピングを実現します。このフレームワークには、劣化した画像を復元する拡散ベースの復元モジュールと、気孔の小さく密集し、かつ雑然とした特性に合わせて設計された専用の回転物体検出ネットワークが組み込まれています。提案ネットワークは、3つの主要な革新により特徴表現を強化します。すなわち、グローバルな特徴相互作用のための列方向の構造、多尺度整合性を改善する文脈に応じた再サンプリングおよび再重み付けメカニズム、そして複雑な背景に対する識別性を高める特徴再組立モジュールです。大規模な比較において、StomaD2は最先端の性能を示しました。公開されているトウモロコシ(Maize)および小麦(Wheat)のデータセットでは、それぞれ0.994および0.992の精度を達成し、既存のベンチマークを大幅に上回りました。Oriented FormerやYOLOv12を含む他の10の高度なモデルと比較したところ、StomaD2はF1-score/mAPで0.989というトップクラスのスコアを達成しました。本フレームワークは、密度や導電率などの8つの気孔フェノタイプを高速に抽出できる、使いやすくフィールドで運用可能なシステムに統合されています。130種以上の植物種で検証されたStomaD2の結果は、その強い汎用性と、大規模なフェノタイピング、植物生理解析、精密農業への応用の可能性を示しています。

StomaD2:拡散ベースの復元検出ネットワークによる知的気孔表現型解析のオールインワンシステム | AI Navigate