アブストラクト: 本論文は、特定のアクチュエータ故障に対して頑健な、固定翼の小型無人航空機システム(sUAS)向けの強化学習ベースの経路追従制御器を提示する。制御器は、ハイパーネットワークに基づく適応によってアクチュエータ故障のパラメータ化により条件付けされる。Feature-wise Linear Modulation(FiLM)およびLow-Rank Adaptation(LoRA)に基づく、パラメータ効率の高い定式化を検討し、それらを近位方策最適化(proximal policy optimization)を用いて学習する。ハイパーネットワークにより条件付けされた方策は、標準的な多層パーセプトロン方策と比較して頑健性を向上できることを示す。特に、ハイパーネットワークにより条件付けされた方策は、学習中に遭遇しなかった時間変動するアクチュエータ故障モードへ対して効果的に汎化する。本アプローチは、高忠実度シミュレーションにより検証されており、現実的な6自由度の固定翼航空機モデルを用いる。
作動機故障下における固定翼航空機のロバスト制御のための、ハイパーネットワーク条件付強化学習
arXiv cs.LG / 2026/4/8
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、作動機故障が発生してもロバストである固定翼小型UAV向けの強化学習による経路追従コントローラを提案する。
- ハイパーネットワークを用いて、作動機故障モードをパラメータ化した表現に基づいて方策を条件付けし、異なる故障条件への適応を可能にする。
- FiLMおよびLoRAによるパラメータ効率の高い条件付けを検討し、その結果得られる方策を近接方策最適化(PPO)で学習する。
- 高忠実度の6自由度固定翼シミュレーションにおける実験では、ハイパーネットワーク条件付方策が、標準的なMLPベースの方策よりもロバスト性で優れていることが示される。
- 本手法は、学習中には提示されていなかった時間変動する作動機故障モードにも汎化できることが報告されている。


