潜在的な不確実性下における安全制御のためのリスク制約付きベリーフ空間最適化

arXiv cs.RO / 2026/4/7

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、意思決定時に直接観測できない重要な不確実性が潜在している場合の、安全性が重大な制御について扱う。これによりシステムダイナミクス、タスクの実行可能性、安全余裕に影響が生じる。
  • 条件付きバリュー・アット・リスク(CVaR)を用いて、安全余裕違反のテールリスクを、回帰(receding)するMPC予測ホライズン全体にわたって明示的に制約する、リスク感度付きベリーフ空間MPPI制御手法を提案する。
  • 著者らは、CVaR制約が確率的な安全保証を与えること、リスク重みがゼロへ近づくとコントローラがリスク中立な最適解へ収束すること、さらに和集合(union-bound)の議論によって、各ステップの保証を繰り返し再計画へ拡張できることを示す。
  • 物理ベースの視覚誘導型デクストラス・ストーイング(巧緻収納)ベンチマークにおいて、姿勢・クリアランス不確実性を扱う本手法は、高いリスク回避の条件下で接触違反ゼロを達成しつつ成功率82%を実現し、リスク中立およびチャンス制約ベースラインを上回る。

要旨: 多くの安全性に重要な制御システムは、センサが意思決定時点で直接解消できない潜在的不確実性の下で動作しなければなりません。この不確実性は、未知の物理特性、外生的な外乱、あるいは観測されていない環境の幾何に起因して生じ、ダイナミクス、タスクの実行可能性、安全マージンに影響を及ぼします。標準的な手法は期待性能を最適化し、まれですが深刻な結果に対する限定的な保護しか提供しません。一方、ロバストな定式化は、不確実性を確率構造を活用せずに保守的に扱います。本研究では、ダイナミクス、コスト、安全制約が、信念分布として維持される潜在パラメータに依存する、部分観測の動的システムを考えます。そして、この信念の下で計画を行い、リセディング・ホライゾン(後退する予測区間)にわたって軌道の安全マージンに関する Conditional Value-at-Risk(CVaR)制約を課す、リスク感受的な信念空間 Model Predictive Path Integral (MPPI) 制御フレームワークを提案します。その結果得られる制御器は、リスク正則化された性能目的を最適化しつつ、潜在パラメータの変動が引き起こす安全違反のテールリスクを明示的に制約します。得られたリスク制約付き制御器について、次の3つの性質を確立します: (1) CVaR 制約は確率的な安全保証を含意する、(2) 目的関数におけるリスク重みがゼロへ近づくと、制御器はリスク中立の最適解を回復する、(3) 和集合境界(union-bound)の議論により、1ホライゾンごとの保証を、反復的な再計算(繰り返しの解法)における累積的な安全へと拡張できる。把持された物体が、規定された側方クリアランス要件を上回る姿勢不確実性を伴う、占有されたスロットへ挿入されなければならない、視覚誘導の巧緻な収納タスクに対する物理ベースのシミュレーションでは、本手法は、高いリスク回避性の下で接触違反ゼロで 82% の成功を達成します。これは、リスク中立の構成とチャンス制約のベースラインに対してそれぞれ 55% と 50% であり、これらはいずれもゼロでない外力接触を伴います。