作動機故障下における固定翼航空機のロバスト制御のための、ハイパーネットワーク条件付強化学習

arXiv cs.LG / 2026/4/8

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、作動機故障が発生してもロバストである固定翼小型UAV向けの強化学習による経路追従コントローラを提案する。
  • ハイパーネットワークを用いて、作動機故障モードをパラメータ化した表現に基づいて方策を条件付けし、異なる故障条件への適応を可能にする。
  • FiLMおよびLoRAによるパラメータ効率の高い条件付けを検討し、その結果得られる方策を近接方策最適化(PPO)で学習する。
  • 高忠実度の6自由度固定翼シミュレーションにおける実験では、ハイパーネットワーク条件付方策が、標準的なMLPベースの方策よりもロバスト性で優れていることが示される。
  • 本手法は、学習中には提示されていなかった時間変動する作動機故障モードにも汎化できることが報告されている。

アブストラクト: 本論文は、特定のアクチュエータ故障に対して頑健な、固定翼の小型無人航空機システム(sUAS)向けの強化学習ベースの経路追従制御器を提示する。制御器は、ハイパーネットワークに基づく適応によってアクチュエータ故障のパラメータ化により条件付けされる。Feature-wise Linear Modulation(FiLM)およびLow-Rank Adaptation(LoRA)に基づく、パラメータ効率の高い定式化を検討し、それらを近位方策最適化(proximal policy optimization)を用いて学習する。ハイパーネットワークにより条件付けされた方策は、標準的な多層パーセプトロン方策と比較して頑健性を向上できることを示す。特に、ハイパーネットワークにより条件付けされた方策は、学習中に遭遇しなかった時間変動するアクチュエータ故障モードへ対して効果的に汎化する。本アプローチは、高忠実度シミュレーションにより検証されており、現実的な6自由度の固定翼航空機モデルを用いる。