Senna-2: 一貫した意思決定と計画のためのVLMとE2E駆動ポリシーの整合
arXiv cs.CV / 2026/3/13
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- Senna-2は、高レベルのVLM決定と低レベルのE2E計画を明示的に整合させ、一貫した意思決定と軌道計画を保証する新しいVLM-E2E駆動ポリシーです。
- 3段階の訓練パラダイムを導入します:意思決定アダプターを用いた駆動事前学習、オープンループのVLM-E2E整合、3DGS環境でのボトムアップ階層型強化学習による閉ループ整合で、安全性と効率を強化します。
- デュアルシステムの一貫性(F1スコア19.3%の改善)、オープンループ設定でのFDE5.7%低減、クローズドループ設定でのAF-CR30.6%低減など、顕著な改善を報告します。
- 結果はトップダウンの指針と意思決定追随の向上を示し、より信頼性の高い軌道と運転の安全性・効率の向上につながります。
視覚言語モデル(VLM)は、高レベルの意味推論を活用することで、エンドツーエンド(E2E)駆動ポリシーの計画能力を強化します。しかし、既存のアプローチは、VLMの高レベルの意思決定とE2Eの低レベルの計画とのデュアルシステムの一貫性を見落とすことが多いです。その結果、生成された軌道が意図した運転決定と一致せず、トップダウンの指針と意思決定追随能力が弱まる可能性があります。この課題に対処するため、私たちはSenna-2を提案します。これは2つのシステムを明示的に整合させ、一貫した意思決定と計画を実現する高度なVLM-E2E駆動ポリシーです。私たちの手法は、一貫性志向の3段階訓練パラダイムに従います。第1段階では、駆動の事前学習を実施し、初期の意思決定と計画を達成します。意思決定アダプターがVLMの決定を暗黙の埋め込みとしてE2Eポリシーへ伝える形をとります。第2段階では、オープンループ設定でVLMとE2Eポリシーを整合させます。第3段階では、3DGS環境でのボトムアップ階層型強化学習を通じて安全性と効率を強化する閉ループ整合を実施します。広範な実験により、Senna-2が卓越したデュアルシステムの一貫性(19.3%のF1スコア改善)を達成し、オープンループ設定での運転の安全性を大幅に向上させ、クローズドループ設定でも改善を示すことを示しています(FDEの5.7%低減、AF-CRの30.6%低減)。
