ポテンシャルベースのリワードシェーピング、制御リャプノフ関数(CLF)、障壁関数(CBF)によるゼロショットで安全かつ時間効率の高いUAVナビゲーション
arXiv cs.RO / 2026/5/5
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、UAVの自律航行と障害物回避の課題に焦点を当て、従来の制御法が複雑で変動する環境で苦戦しうる点を指摘している。
- ポテンシャルベースのリワードシェーピング(PBRS)と、制御リャプノフ関数(CLF)および制御障壁関数(CBF)を統合し、ミッション時間の最適化と形式的な安全保証を同時に実現することを提案している。
- 一般化された単純な環境で強化学習(RL)モデルを学習し、その後はCLF–CBF–QPフィルタを用いて複雑なシナリオに追加学習なしで適用する枠組みになっている。
- シミュレーション実験では、ミッション時間の大幅な短縮と、複雑環境での優れた性能が示された。
- 全体として、本研究は安全性が重要な制御に対して構造化された形式的制約を学習システムへ組み込むことで、RLの適応性と安全要件の両立を目指している。




