GSDrive:3Dガウススプラッティング環境によるマルチモード軌道プロービングで運転ポリシーを強化

arXiv cs.RO / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • GSDriveは、新しいエンドツーエンド自動運転の学習フレームワークで、致命的な(疎な)イベントベース報酬によって起こる問題を、模倣学習(IL)と強化学習(RL)の組み合わせで解決することを目指します。
  • この手法では3Dガウススプラッティング(3DGS)を用いて、微分可能な物理ベースのシミュレーション環境を構築し、報酬関数をシミュレートされた相互作用に基づけて設計します。
  • さらに、フローマッチング方式の軌道予測器を組み込み、複数の候補軌道(マルチモード)を生成してシミュレータ上でロールアウトし、見込みのある報酬を比較・評価します。
  • これにより、衝突などの致命的な結果のみに依存する疎なフィードバックではなく、より密で即時的な学習フィードバックを提供して、劣った行動への早期収束を抑えます。
  • 再構成nuScenesデータセットでの評価では、クローズドループ実験において既存のシミュレーションベースRLの手法を上回り、コードも公開されています。