確率的ニューラルネットワークのダイナミクスに対する不確実性を考慮した予測型安全フィルタ
arXiv cs.LG / 2026/4/30
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、予測型安全フィルタを確率的アンサンブル(PE)ニューラルネットワークのダイナミクスで強化する「Uncertainty-Aware Predictive Safety Filter(UPSi)」を提案する。
- UPSiは将来の結果を到達可能集合(reachable sets)として定式化し、「モデルの悪用」を防ぐ明示的な確実性(certainty)制約により、不確実性の定量化をより厳密にする。
- この手法は、特にDyna-styleのMBRLにおいて、標準的なモデルベース強化学習(MBRL)のワークフローにそのまま組み込めるように設計されている。
- 一般的な安全強化学習ベンチマークでの評価では、従来のニューラルネットワークベースの予測型安全フィルタに比べて探索の安全性が大きく改善しつつ、標準的なMBRLと同程度の性能を維持することが示される。
- 総じてUPSiは、現代的な確率的MBRLのスケーラビリティと汎用性、ならびに予測型安全フィルタの形式的な安全保証のギャップを埋めるものとして位置付けられている。



