マップなしレーシングのための空間密度速度ポテンシャルに関する物理インフォームド強化学習

arXiv cs.RO / 2026/4/13

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、瞬時のセンサデータから直接動作する強化学習を用い、加速度およびタイヤ摩擦の限界を尊重しながら、地図なしの自律走行レースにおける課題に取り組む。
  • 深度計測のスペクトル分布に基づいて非線形な車両ダイナミクスをパラメータ化する物理インフォームドDRL手法を提案し、時間最適および追い越し制御を学習する。
  • シミュレーションから現実への転移とハードウェアの安定性を改善するために、本手法は物理エンジンのエクスプロイトを考慮した報酬を用い、明示的な衝突ペナルティを、価値予測の地平線を暗黙に打ち切ることに置き換える。
  • 学習した方策は、人間のデモンストレーションよりも強いOOD(分布外)性能を示し、比例スケールしたハードウェア上でOODコースに対して報告上12%の改善を達成する。さらに、実験的なPacejkaモデルに類似したタイヤダイナミクスにより摩擦円を最大化する。
  • システム同定の結果から、2段階のネットワーク挙動が示唆される。すなわち、最初の層が空間観測をより高解像度のデジタル化されたトラック特徴へ圧縮する(特にコーナーのアペックス付近)。次に2番目の層が非線形な車両ダイナミクスをエンコードする。