GSDrive：3Dガウススプラッティング環境によるマルチモード軌道プロービングで運転ポリシーを強化

arXiv cs.RO / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureModels & Research

共有:

要点

GSDriveは、新しいエンドツーエンド自動運転の学習フレームワークで、致命的な（疎な）イベントベース報酬によって起こる問題を、模倣学習（IL）と強化学習（RL）の組み合わせで解決することを目指します。
この手法では3Dガウススプラッティング（3DGS）を用いて、微分可能な物理ベースのシミュレーション環境を構築し、報酬関数をシミュレートされた相互作用に基づけて設計します。
さらに、フローマッチング方式の軌道予測器を組み込み、複数の候補軌道（マルチモード）を生成してシミュレータ上でロールアウトし、見込みのある報酬を比較・評価します。
これにより、衝突などの致命的な結果のみに依存する疎なフィードバックではなく、より密で即時的な学習フィードバックを提供して、劣った行動への早期収束を抑えます。
再構成nuScenesデータセットでの評価では、クローズドループ実験において既存のシミュレーションベースRLの手法を上回り、コードも公開されています。

Dev.to

ITmedia AI+

Reddit r/artificial

Dev.to

ITmedia AI+