窒素欠乏検出のために、キャベツ作物のハイパースペクトル・データセットを作業しています。このデータセットには3つのクラスがあります:
健康
軽度の窒素ストレス
重度の窒素ストレス
表現学習のために自己教師あり学習(SSL)を使い、その後分類のために微調整したいと考えています。
これまでにやったこと:
複数のSSL手法を試しました:BYOL、MAE、VICReg
データ拡張を使用しました(スペクトルノイズ、マスキング、スケーリングなど)
分類器ヘッドで微調整しました
精度とF1スコアで評価しました
問題:
何を試しても、性能がだいたい次のあたりで頭打ちです:
精度:~45–50%
F1スコア:これも低いです(~0.5)
これはランダムよりほとんど良くありません(3クラスなので約33%)。
環境:
ハイパースペクトルデータ(数百バンド)
1D/パッチベースのモデル(ViT風)
SSL事前学習 → 微調整パイプライン
k-NNや線形プローブも試しましたが、それでも弱いです
推測:
クラスがスペクトル的にうまく分離できていない可能性
RGB向けに設計されたSSL手法がうまく適応できていない可能性
拡張が助けるというより害になっている可能性
モデルがスペクトル固有のパターンを捉えられていない可能性
探しているもの:
以下についての提案があると本当に助かります:
ハイパースペクトル向けのより良いSSL手法
このケースでは本当にVICRegが最適な選択なのでしょうか?
代わりにマスク付きのスペクトルモデリングを試すべきでしょうか?
特徴量エンジニアリング
植生指数(NDVIなど)を含めるべきですか?
学習の前にPCAを行うべきですか?
モデルアーキテクチャ
1D CNN vs ViT vs ハイブリッド?
ハイパースペクトルで実績のあるアーキテクチャはありますか?
評価
SSLの表現を検証する最善の方法は?
線形プローブの結果を改善するコツはありますか?
一般的なアドバイス
植物ストレス/ハイパースペクトル分類に取り組んだことのある方はいますか?
共通の
[link] [comments]



