自動運転車における相互依存する要求事項のテストに対する強化学習:実証研究

arXiv cs.RO / 2026/4/29

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 本研究は、要求が相互に依存しトレードオフが生じる状況で、自動運転車のシナリオベーステストを生成するのに単一目的強化学習(SORL)と多目的強化学習(MORL)のどちらが適しているかを検証します。
  • エンドツーエンドのAVコントローラと高忠実度シミュレータを用い、機能要件と安全要件の両方にまたがる違反を引き起こす重要シナリオ生成について、SORLとMORLを実証的に比較しました。
  • 結果として、全体の有効性は多くの場合で同程度である一方、違反の性質には差があり、MORLは要求違反シナリオをより多く生成しやすく、SORLはより重大な違反を生じやすい傾向が示されました。
  • 競合の相対的な性能は目的関数の組み合わせにより変動し、道路条件の影響はそれより小さいことも明らかになっています。
  • 本論文は、SORLとMORLを体系的に比較して評価ギャップを埋めるとともに、RLベースのAVテスト戦略では要求事項間の依存関係を考慮する重要性を強調しています。