町をまたいだ夢:セマンティック・ロールアウトとタウン敵対的正則化によるCARLAでのゼロショット固定ルート走行

arXiv cs.RO / 2026/5/1

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文はCARLAにおける自動運転エージェントのゼロショット汎化を扱い、天候を固定し、交通・歩行者を排した制御条件のもとで、Town05/Town06で学習した固定ルート走行ポリシーを未見のTown03/Town04へ転移します。
  • Dreamerスタイルの潜在世界モデルエージェントをベースにし、訓練時補助損失として、想像ロールアウト上での将来の視覚セマンティック埋め込みのマルチホライズン予測と、再帰潜在状態のセマンティック射影に対するタウン敵対的正則化を導入します。
  • 因果的コンテキスト特徴でセマンティック・ロールアウト予測器を条件付けしつつ、アクター/クリティックは標準の制御特徴を維持し、ポリシーにはナビゲーション指令や経路ポリライン、ゴール姿勢、地図入力などを与えません(ルートはシミュレータ側で報酬・進捗・成功・終了判定にのみ使用されます)。
  • 実験の結果、比較したDreamer系手法の中で提案手法が、評価した未見タウンにおける平均成功率で最も高いことが示されます。
  • 総じて著者らは、この制御されたCARLA設定において、セマンティック・ロールアウトの監督とタウン敵対的正則化を組み合わせることで、未見タウンでの固定ルート完了が改善されると結論づけています。

Abstract

学習済みの運転エージェントは、未知の環境に投入すると劣化することが多い。本論文では、その問題をあえて意図的に境界づけた形でCARLAシミュレータ内で検討する。具体的には、クローズドループの固定経路運転エージェントをTown05およびTown06から、未知のTown03およびTown04へゼロショット転移する。研究では、天候をClearNoonのまま固定し、交通と歩行者を除去することで、構造的なタウンシフトを切り離す。Dreamerスタイルの潜在世界モデル型エージェントを基盤とし、学習時のみの補助損失を2つ追加する。すなわち、想像ロールアウトに沿った将来の視覚・意味埋め込みの多期間予測と、再帰的な潜在状態の意味的射影に対するタウン敵対的(adversarial)な教師信号である。因果的な文脈特徴が意味ロールアウト予測器を条件付けし、一方で俳優(actor)と批評家(critic)は標準的な制御特徴を維持する。方策はナビゲーション指令、経路ポリライン、目標姿勢、または地図入力を受け取らない。参照経路は、報酬、進捗、成功、ならびに終了のために環境側でのみ用いられる。評価対象の未使用(held-out)タウン全体において、提案モデルは、含まれているDreamer系の手法の中で最も高い平均成功率を達成する。二次的な安全性および車線維持の指標は、タウン間で混在している。これらの結果は、境界づけられた結論を支持する。この制御された固定天候のCARLA設定において、意味ロールアウトの教師信号にタウン敵対的な正則化を組み合わせることは、未使用タウンでの平均経路完了を改善する。