CarPLAN: 動的シーン認識を備えた文脈適応型・堅牢な自動運転計画

arXiv cs.AI / 2026/3/16

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

CarPLAN は Displacement-Aware Predictive Encoding（DPE）を導入し、自動運転車と周囲のシーン要素間の将来の変位ベクトルを予測することで空間認識を向上させ、文脈認識に基づく計画を可能にします。
他のエージェントとの相対距離を考慮できるよう、変位予測誤差に対する追加の損失項を導入しました。
本フレームワークは Mixture of Experts に基づく Context-Adaptive Multi-Expert Decoder（CMD）を用いて、各 Transformer レイヤーで適切なデコーダを動的に選択し、多様な交通シーンに対応した適応的な計画を実現します。
CarPLAN は nuPlan ベンチマークで最先端の性能を達成し、難易度の高いシナリオ（例: Test14-Hard）での頑健性と Waymax ベンチマークでの一般化を示します。

要約: 模倣学習（IL）はデータ効率と実世界の運転データへのアクセスの点で、自動運転のモーションプランニングに広く用いられている。安全で堅牢な実世界の運転のためには、ILベースの計画は、実世界データに内在する複雑な運転コンテキストを捉え、コンテキスト適応型の意思決定を可能にする必要があり、単に専門家の軌道模倣に依存すべきではありません。本論文では、CarPLAN を提案します。これは新規の IL ベースのモーションプランニングフレームワークで、運転コンテキストの理解を明示的に高め、多様な交通状況に跨る適応計画を可能にします。私たちの寄与は二つあります。Displacement-Aware Predictive Encoding（DPE）を導入し、自動運転車（AV）と周囲のシーン要素との未来の変位ベクトルを予測することで、モデルの空間認識を向上させます。これにより、軌道を生成する際の相対的な間隔を計算に組み込むことができます。標準的な模倣損失に加え、変位予測誤差を捉える拡張損失項を組み込み、他のエージェントとの相対距離を考慮した計画決定を保証します。多様な運転コンテキストに対応する能力を高めるため、Mixture of Experts（MoE）フレームワークを活用するContext-Adaptive Multi-Expert Decoder（CMD）を提案します。CMD は、各Transformer層のシーン構造に基づき、最も適切なエキスパートデコーダを動的に選択し、動的環境での適応的でコンテキスト認識型の計画を実現します。 nuPlan ベンチマークで CarPLAN を評価し、すべてのクローズドループシミュレーション指標で最先端の性能を示します。特に、Test14-Hard のような難易度の高いシナリオで堅牢な性能を示し、複雑な運転条件での有効性を検証します。Waymax ベンチマークでの追加実験は、異なるベンチマーク設定間での一般化能力をさらに示します。

AIはバブルになりつつあり、ドットコム崩壊のような結末を迎えるのか？

Reddit r/artificial

状態の外部化

Dev.to

1対1のRTSゲームで、LLMsがユニットを制御するコードを書く『ベンチマーク』を作成した

Dev.to

私のAIには時計がない

Dev.to

コーディング向けの LLM をどう選ぶべきか？注目すべきパラメータは何か？

Reddit r/LocalLLaMA

CarPLAN: 動的シーン認識を備えた文脈適応型・堅牢な自動運転計画

要点

関連記事

AIはバブルになりつつあり、ドットコム崩壊のような結末を迎えるのか？

状態の外部化

1対1のRTSゲームで、LLMsがユニットを制御するコードを書く『ベンチマーク』を作成した

私のAIには時計がない

コーディング向けの LLM をどう選ぶべきか？注目すべきパラメータは何か？

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

AIはバブルになりつつあり、ドットコム崩壊のような結末を迎えるのか？

状態の外部化

1対1のRTSゲームで、LLMsがユニットを制御するコードを書く『ベンチマーク』を作成した

私のAIには時計がない

コーディング向けの LLM をどう選ぶべきか？ 注目すべきパラメータは何か？

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

コーディング向けの LLM をどう選ぶべきか？注目すべきパラメータは何か？