Pontryaginの最大原理を用いた予測的安全フィルタ学習のための境界サンプリング

arXiv cs.RO / 2026/4/16

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、制約をほぼ違反する「境界」軌道を対象にした、安全フィルタ学習のためのデータ収集戦略を提案する。ここではPontryaginの最大原理(PMP)を用いる。
  • これらの境界軌道は、学習されたHamilton-Jacobi到達可能性(Reachability)の訓練を導くために用いられ、高次元システムにおいて安全に関わる臨界状態の近傍にデータを集中させることで、サンプル効率を向上させる。
  • 得られる学習済みControl Barrier Value Functionは、自律的な意思決定に直接用いる安全フィルタとして機能する。
  • 共制御型自動車レースに関するシミュレーションおよび実験では、PMPベースのサンプリングが収束速度を改善し、失敗率を低減し、安全集合の再構成を向上させることが報告されており、壁時計時間は約3msである。