分離された制御による運転世界の構成と敵対的シナリオ生成

arXiv cs.CV / 2026/3/16

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • CompoSIA は、シーン構造、物体のアイデンティティ、エゴアクションを分離する構成的な運転用ビデオシミュレータであり、細かな敵対的運転シナリオ生成を可能にします。
  • ノイズレベルのアイデンティティ注入を導入して、単一の参照画像からポーズに依存しないアイデンティティ生成を実現し、多様なポーズ間でのアイデンティティ置換を可能にします。
  • シナリオ合成中のエゴアクションの制御性を向上させる、階層的なデュアルブランチのアクション制御機構を提案します。
  • 基準法に対して定量的な改善を報告しており(アイデンティティ編集の FVD で 17% の改善、回転誤差と平行移動誤差がそれぞれ 30% および 47% 削減)、ストレステストで実質的なプランナーの失敗を明らかにしている(平均衝突率が 173% 増加)。

要旨: 自動運転における最大の課題は、安全上重大なエッジケースの長い尾であり、これらは一般的な交通要素の珍しい組み合わせからしばしば生じる。これらのシナリオを合成することは重要だが、現行の可制御生成モデルは不完全または絡み合った指示を提供し、シーン構造、オブジェクトの識別、そして自車の挙動を独立して操作することを妨げている。CompoSIA は、これらの交通要素を解きほぐす構成的な運転映像シミュレータであり、多様な敵対的な運転シナリオに対して細粒度の制御を可能にする。シーン要素のアイデンティティを制御可能に置換することを支援するために、ノイズレベルのアイデンティティ注入を提案する。これにより、多様な要素のポーズに依存しないアイデンティティ生成を、単一の参照画像から可能にする。さらに、アクション制御性を向上させるために、階層的なデュアルブランチのアクション制御機構を導入する。このような分離された制御は、敵対的シナリオの合成を可能にする。すなわち、安全な要素を体系的に組み合わせて、絡み合った生成モデルが生み出せない危険な構成を作り出すことができる。広範な比較により、最先端のベースラインよりも制御可能な生成品質が優れていることを示しており、アイデンティティ編集の FVD が 17% 改善され、アクション制御における回転誤差と平移誤差がそれぞれ 30% および 47% 減少した。さらに、下流のストレステストにより、プランナーの重大な障害が明らかになる。編集モダリティ全体で、3s の平均衝突率が 173% 増加する。