低精度(約50%)——SSL(BYOL/MAE/VICReg)を高スペクトル作物ストレスデータに適用してうまくいかない:何が足りない?[R]

Reddit r/MachineLearning / 2026/4/17

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 葉物キャベツの窒素欠乏検出を目的に、高スペクトル(hyperspectral)データを使って自己教師あり学習(BYOL/MAE/VICReg)で表現を学習し、その後に分類のために微調整する取り組みを行っている。
  • いくつかのSSL手法とスペクトル向けのデータ拡張(ノイズ追加、マスキング、スケーリング等)を試しても、精度は約45〜50%に張り付いたままで、F1スコアも低く、3クラスのランダム推測(約33%)よりわずかに良い程度にとどまっている。
  • 学習済み表現に対してk-NNや線形プローブも試したが改善せず、クラスを分けるスペクトル特徴を表現がうまく捉えられていない可能性が示唆される。
  • クラスがスペクトル的に十分分離しにくいこと、RGB向けに設計されたSSLが高スペクトル信号にうまく適応できていないこと、あるいは拡張が学習をむしろ妨げていることなどを懸念し、より良いSSLやアーキテクチャ(マスク付きスペクトルモデリング、NDVI等の植生指数、PCAの有無)を求めている。
  • SSL表現の妥当性確認の方法や、高スペクトルの植物ストレス分類で実績のあるモデル設計(1D CNN vs ViT vs ハイブリッド、評価のコツ等)について具体的な助言を求めている。

窒素欠乏検出のために、キャベツ作物のハイパースペクトル・データセットを作業しています。このデータセットには3つのクラスがあります:

健康

軽度の窒素ストレス

重度の窒素ストレス

表現学習のために自己教師あり学習(SSL)を使い、その後分類のために微調整したいと考えています。

これまでにやったこと:

複数のSSL手法を試しました:BYOL、MAE、VICReg

データ拡張を使用しました(スペクトルノイズ、マスキング、スケーリングなど)

分類器ヘッドで微調整しました

精度とF1スコアで評価しました

問題:

何を試しても、性能がだいたい次のあたりで頭打ちです:

精度:~45–50%

F1スコア:これも低いです(~0.5)

これはランダムよりほとんど良くありません(3クラスなので約33%)。

環境:

ハイパースペクトルデータ(数百バンド)

1D/パッチベースのモデル(ViT風)

SSL事前学習 → 微調整パイプライン

k-NNや線形プローブも試しましたが、それでも弱いです

推測:

クラスがスペクトル的にうまく分離できていない可能性

RGB向けに設計されたSSL手法がうまく適応できていない可能性

拡張が助けるというより害になっている可能性

モデルがスペクトル固有のパターンを捉えられていない可能性

探しているもの:

以下についての提案があると本当に助かります:

ハイパースペクトル向けのより良いSSL手法

このケースでは本当にVICRegが最適な選択なのでしょうか?

代わりにマスク付きのスペクトルモデリングを試すべきでしょうか?

特徴量エンジニアリング

植生指数(NDVIなど)を含めるべきですか?

学習の前にPCAを行うべきですか?

モデルアーキテクチャ

1D CNN vs ViT vs ハイブリッド?

ハイパースペクトルで実績のあるアーキテクチャはありますか?

評価

SSLの表現を検証する最善の方法は?

線形プローブの結果を改善するコツはありますか?

一般的なアドバイス

植物ストレス/ハイパースペクトル分類に取り組んだことのある方はいますか?

共通の

submitted by /u/DoubleFun4398
[link] [comments]