学習された安全フィルタと適応的コンフォーマル推論による安全制御
arXiv cs.RO / 2026/4/21
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、危険な名目(nominal)方策に対して制御システムの安全性を確保するための学習型安全フィルタと適応的コンフォーマル推論を組み合わせた Adaptive Conformal Filtering(ACoFi)を提案する。
- ACoFiは、観測された予測誤差と、名目方策の安全性評価に対する不確実性レンジ推定を用いて、切替基準を動的に更新する。
- 推定されたレンジが名目アクションの安全性が低い可能性を示す場合、固定しきい値に依存せず学習された安全方策へ切り替える。
- 「ソフト」な安全保証として、名目方策の予測安全性に対する不確実性の誤った定量化の発生率が、ユーザーが指定したパラメータによって漸近的に上から抑えられることを示す。
- Dubinsカ―のシミュレーションとSafety Gymnasiumでの評価により、ACoFiは固定しきい値ベースラインよりも、学習された安全性が高く安全違反が少ないことを示し、特に分布外(out-of-distribution)では改善が顕著である。
関連記事

新しいモデルが出るたびに、当然ながら古いモデルは時代遅れになる
Reddit r/LocalLLaMA

NVIDIA DGX SparkフルスタックAIハッカソンで作ったものが総合1位に—『Starfire』から『Molecules AI』へ
Dev.to

進捗を失わない:VS Codeでプロ仕様のJupyterワークフローをセットアップする(Colabのタイムアウトともおさらば!)
Dev.to

AgentOSを作る:保険請求の「AWS Lambda」を目指している理由
Dev.to

状況はここまで来た——1年で何もかも変わった:Kimi、Minimax、Qwen、Gemma、GLM
Reddit r/LocalLLaMA