広告

PiCSRL:物理インフォームド・コンテキスト付きスペクトル強化学習

arXiv cs.LG / 2026/3/31

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • PiCSRLは、高次元・少サンプルサイズ(HDLSS)データにおいて、ラベル付きデータが乏しい状況でも、より効果的な適応的センシングを可能にするための、物理インフォームド・コンテキスト付きスペクトル強化学習フレームワークとして提案される。
  • 本手法は、埋め込みを構築することでドメイン知識を注入し、さらに物理インフォームドな特徴をRLの状態表現へ直接マッピングする。加えて、不確実性を考慮した信念(belief)モデルを併用することで、予測品質の向上を図る。
  • NASAのPACEによるエリー湖のハイパースペクトル画像を用いた評価では、シアノバクテリアの遺伝子濃度サンプリングにおいて、PiCSRLはランダムおよびUCBのベースラインよりも大幅に優れたステーション選択性能を報告している。
  • アブレーション結果から、物理インフォームドな特徴は半教師ありのテストにおける汎化を改善し、スペクトルの生バンドのみを用いる場合よりも向上が得られることが示されている。
  • スケーラビリティ実験では、PiCSRLが大規模なネットワーク設定(例:50ステーション、2Mを超える組み合わせ)にも対応できる一方で、統計的有意性をもってベースラインよりも優れていることが示唆される。

概要: 高次元・少数サンプル(HDLSS)データセットは、ラベル付きデータが依然として乏しいため、信頼できる環境モデル開発を制約します。強化学習(RL)に基づく適応的センシング手法は、最適なサンプリング方策を学習できますが、HDLSSの状況での適用は深刻に制限されています。本研究では、PiCSRL(Physics-Informed Contextual Spectral Reinforcement Learning)を提案します。ここでは、埋め込みをドメイン知識を用いて設計し、改善された適応的センシングのために、RLの状態表現へ直接パースします。さらに、物理に基づく特徴を符号化して予測を改善する、不確実性を考慮したベリーフ(信念)モデルを開発しました。代表的な例として、五大湖エリー湖におけるNASA PACEのハイパースペクトル画像を用い、シアノバクテリアの遺伝子濃度の適応的サンプリング課題に対して本手法を評価しました。PiCSRLは最適なステーション選択を達成します(RMSE = 0.153、ブルーム検出率98.4%)。これは、ランダム(0.296)およびUCB(0.178)のRMSEベースラインをそれぞれ上回ります。アブレーション実験の結果、物理に基づく特徴が半教師あり学習におけるテストの汎化を改善することが示されました(0.52 R^2、+0.11、ラベルなしの生バンドに対して)。加えて、スケーラビリティ試験では、PiCSRLが大規模ネットワーク(50ステーション、>2Mの組み合わせ)へ効果的にスケールし、ベースラインに対して有意な改善を示しました(p = 0.002)。本研究では、PiCSRLを、観測からターゲットへのマッピングを改善するための、地球観測領域全般にわたるサンプル効率の高い適応的センシング手法として位置づけます。

広告