ScenarioControl:視覚と言語で制御するベクトル化潜在における運転シナリオ生成
arXiv cs.RO / 2026/4/21
💬 オピニオンDeveloper Stack & InfrastructureModels & Research
要点
- ScenarioControlは、テキストプロンプトまたは入力画像をもとに、現実的な3Dの運転シナリオ・ロールアウトを生成するための、学習済み運転シナリオ生成に対する初の「視覚×言語」制御メカニズムだと提案されています。
- この手法は、道路地図、時間経過に伴う反応的なアクターの3Dボックス、歩行者、走行インフラ、さらに自車カメラ視点といった要素を含み、時間的一貫性を保ったシーン生成を行います。
- ベクトル化された潜在空間で、道路構造と動的エージェントを共同表現し、制御の細かさと現実性の両立のために、クロスアテンションと軽量なグローバル文脈ブランチを統合する「クロスグローバル制御」を用います。
- 学習・評価のために、ベクトル化マップ構造に整合したテキスト注釈付きデータセットを公開し、比較手法に対して制御の追従性と忠実度が良好であることを実験で示しています。
- その結果、異なるアクター視点からの協調的なロールアウト生成だけでなく、長期(ロングホライズン)での運転シナリオ継続にも対応します。




