長時間ホライズンの確率的最適制御に対するシュレーディンガー固有関数法

arXiv cs.LG / 2026/3/25

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、高次元の確率的最適制御におけるスケーラビリティ問題、すなわち、長いホライズン長 T に対して既存手法の性能が低下し、スケールが悪化する問題に取り組む。
  • 未制御ドリフトがポテンシャルの勾配であるという条件を満たす、あるクラスの線形に可解な SOC 問題において、ハミルトン–ヤコビ–ベルマン方程式は線形な偏微分方程式(PDE)へと帰着でき、その作用素が純粋に離散なスペクトルをもつシュレーディンガー作用素にユニタリー同値であることが示される。
  • このスペクトル的な関係により、PDE 作用素の固有系(eigensystem)を用いて長時間制御を効率的に特徴づけることが可能となり、T に対して線形にスケールする必要がなくなる。
  • 対称な線形二次レギュレータ(LQR)問題では、対応するシュレーディンガー作用素が量子調和振動子のハミルトニアンと一致し、その結果として、任意の終端コストに対する対称 LQR を解く閉形式の固有関数/固有系が得られる。
  • さらに一般の場合、著者らはニューラルネットワークによって固有系を学習することを提案し、先行研究における固有関数学習の損失に潜在する暗黙の再重み付けの問題を診断したうえで、それを緩和する新しい損失関数を導入する。加えて、長時間ホライズンのベンチマークにおいてオーダー・オブ・マグニチュードの改善を報告し、メモリ/計算時間の複雑度を O(Td) から O(d) に低減している。