ガウス過程による反復的モデル学習スキーム：非線形モデル予測制御（半バッチプロセス向け）

arXiv cs.LG / 2026/4/27

📰 ニュースDeveloper Stack & InfrastructureIndustry & Market MovesModels & Research

共有:

要点

この論文は、動的モデルが高価、または利用できない状況でも非線形モデル予測制御（NMPC）を可能にするために、ガウス過程（GP）を用いたモデル学習型NMPCスキーム（GP-MLMPC）を提案している。
方法は、単一の初期軌道のデータ（例：PIコントローラ）でGP-MLMPCを初期化し、その後、GPを組み込んだNMPCでバッチを繰り返し運転しながら、新しい観測データでGPを反復更新する。
GPによる不確実性推定を用いて確率制約（chance constraints）を定式化し、指定した信頼度レベルで安全な運転を実現する。
シミュレーション上の半バッチ重合リアクタでの結果では収束が速く、4回のバッチ反復で追従誤差が初期軌道に比べて83%改善したほか、経済目的では8回目の反復で最終生成物質量が初期軌道比で17倍になった。
著者らは、GP-MLMPCが機構（メカニスティック）なプロセス知識を不要としつつ、サンプル効率も高く、フルモデルNMPCに匹敵する性能を達成できると報告している。

要旨: バッチプロセスは本質的に一時的であり、通常は非線形であるため、非線形モデル予測制御（NMPC）が動機づけられる。しかし、NMPCの導入は、コストや動的モデルの利用不可能性によって妨げられる。そこで、本論文では、バッチプロセスに対して、モデル学習NMPCスキーム（GP-MLMPC）にガウス過程（GP）を用いることを提案する。我々は単一の初期軌道のデータ（例えばPIコントローラから得られるデータ）を用いてGP-MLMPCを初期化する。次に、NMPCにGPを組み込んだものを反復的に適用してバッチを実行し、各反復から得られる新たな観測に基づいてGPを更新することで、バッチごとの改善を実現する。GPによる不確実性定量化を用いて、所望の信頼水準に応じた安全な運転を保証するための確率制約（チャンス制約）を定式化する。我々は、半バッチ重合反応器において、
\textit{silico}で提案手法を示し、2時間の所要期間にわたる追従目的と経済性目的の両方に対して評価する。反応器温度は、その設定値の周りで $\pm2^\circ C$ の範囲に制限される。GP-MLMPCスキームでは、4回のバッチ反復のみで、追従誤差が初期軌道に比べて83%の低減へ収束した。さらに、経済性目的の下では、GP-MLMPCは反復8において初期軌道と比べて最終生成物質量を17倍に増やした。いずれの場合も、得られるGP-MLMPCの性能はフルモデルNMPCに匹敵し、最適な制御器が当該アプローチによって学習できることを示している。最適軌道の周りにサンプルを収集することで、GP-MLMPCは反復を通じてサンプル効率が高く、迅速な収束を達成する。したがって、提案するGP-MLMPCスキームは、機械論的知識なしで非線形バッチプロセスを制御するための有望なデータ効率の高い手法である。