GSDrive:3Dガウススプラッティング環境によるマルチモード軌道プロービングで運転ポリシーを強化
arXiv cs.RO / 2026/5/1
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- GSDriveは、新しいエンドツーエンド自動運転の学習フレームワークで、致命的な(疎な)イベントベース報酬によって起こる問題を、模倣学習(IL)と強化学習(RL)の組み合わせで解決することを目指します。
- この手法では3Dガウススプラッティング(3DGS)を用いて、微分可能な物理ベースのシミュレーション環境を構築し、報酬関数をシミュレートされた相互作用に基づけて設計します。
- さらに、フローマッチング方式の軌道予測器を組み込み、複数の候補軌道(マルチモード)を生成してシミュレータ上でロールアウトし、見込みのある報酬を比較・評価します。
- これにより、衝突などの致命的な結果のみに依存する疎なフィードバックではなく、より密で即時的な学習フィードバックを提供して、劣った行動への早期収束を抑えます。
- 再構成nuScenesデータセットでの評価では、クローズドループ実験において既存のシミュレーションベースRLの手法を上回り、コードも公開されています。




