記事からキャノピーへ:LLMエキスパートによる樹種分類のための知識駆動型疑似ラベリング
arXiv cs.CV / 2026/4/20
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、限られた/偏ったラベル、複数種にまたがるスペクトル混合、そして生態系に起因するばらつきといった課題に対し、スペクトルだけに依存せず、樹冠アーキテクチャや種間相互作用などの生物学的・構造的情報を統合して取り組む。
- 疑似ラベリングを事前計算した樹冠グラフ上で行う、HSI(ハイパースペクトル画像)とALS(航空レーザ計測)を融合した生物学的知見に基づく半教師あり深層学習手法を提案し、学習コストを抑える。
- 大規模言語モデル(LLM)を用いて信頼できる情報源から種の共存(コハビテーション)に関する事前知識を自動抽出・導出し、同時出現の尤度をもつ共存行列として符号化して疑似ラベリング戦略に組み込む。
- 実データの森林データセットで、最良の参照手法に対して5.6%の改善が示され、さらに専門家による評価では共存事前知識の精度が高く、差が15%以内であることが確認された。
- 総じて、LLM由来の生態学的事前知識を疑似ラベリングの深層学習パイプラインに統合することで、データ不足下でも分類の頑健性を高められることを実証している。



