要旨: 不確実で適応するシステムの安全性が重要な制御は、多くの場合、閉ループ性能を制限する保守的な、最悪ケースの不確実性境界に依存しています。オンライン共形予測(conformal prediction)は、予測された出力の真値がオンラインで明らかになるときの不確実性を定量化するための強力なデータ駆動手法です。しかし、状態の微分に関する測定なしに動力学を適応させるシステムでは、標準的なオンライン共形予測ではモデル不確実性を定量化するのに不十分です。本稿では、撹乱と学習誤差の束ねられた効果を定量化するための積分スコア関数を用いるアルゴリズム「Staggered Integral Online Conformal Prediction(SI-OCP)」を提案します。この手法は長期にわたる被覆(カバレッジ)保証を提供し、安全性が重要なコントローラ、たとえばロバスト・チューブ・モデル予測制御(robust tube model predictive control)と統合した場合に長期的な安全性につながります。最後に、本提案手法の妥当性を、ロバスト・チューブMPCを用いた全層ディープニューラルネットワーク(DNN)による適応型クアッドコプタの数値シミュレーションによって検証し、複雑な学習パラメータ化および制御戦略への本手法の適用可能性を示します。
安全なダイナミクス適応のための段階的積分オンライン共形予測:多段階のカバレッジ保証付き
arXiv cs.RO / 2026/4/8
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、状態の時間微分が計測されない適応ダイナミクスに対して、標準的なオンライン共形予測が不確実性を確実に定量化できず、そのため不確実な適応システムに対する安全保証が制限されると主張する。
- そこで、擾乱と学習誤差の結合した影響を抑えるために、積分スコア関数を用いる段階的積分オンライン共形予測(SI-OCP)を提案する。
- SI-OCPは、安全性が要求される制御器と組み合わせた場合に、長期(長ホライズン)のカバレッジ保証を提供し、持続的な安全性を可能にするよう設計されている。
- 数値シミュレーションにより、ロバストなチューブ型モデル予測制御を用いた、全層型の深層ニューラルネットワークによる適応クワッドコプタで手法を示し、複雑なDNNベースのパラメータ化に対する適用可能性を明らかにする。
- 本研究は、過度に保守的な最悪ケースの不確実性境界を超えて性能を向上させつつ、時間を通じて証明可能な安全カバレッジを維持する手段としてSI-OCPを位置付ける。



