RAD-LAD: 実時間におけるルールと言語に基づく自律運転

arXiv cs.RO / 2026/3/31

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、割り込み可能なアーキテクチャを備えた実時間の言語-行動プランナーであるLADを導入する。LADは、約20 Hzで1回の順伝播により運動計画を出力するか、運動計画とともに約10 Hzでテキストによる推論を提示する。
報告によれば、LADは従来の運転向け言語モデルと比べてレイテンシを約3倍低減し、学習ベースの手法によりnuPlan Test14-HardおよびInterPlanで最先端の結果を達成する。
著者らはまた、PDM-Closedの構造的限界を克服することを目的としたルールベースのプランナーであるRADを提案し、同じnuPlanベンチマークにおいてルールベースのプランナーとしてトップクラスの性能を示す。
RADとLADを組み合わせることで、本研究は、確実な操縦にはルールを、適応的で説明可能な意思決定には言語を活用するハイブリッド計画を示す。
全体として、本提案は、割り込み可能な言語駆動計画と、ルールベースの安全性/構造を、閉ループ環境における自律運転のための補完的な構成要素として位置付ける。

要旨: 我々は、LADを提示する。LADは、割り込み可能なアーキテクチャを備えたリアルタイムの言語—行動プランナーであり、1回の前向きパスでモーション計画を生成する（約20 Hz）か、モーション計画と並行してテキストによる推論を生成する（約10 Hz）。LADはリアルタイムのクローズドループ運用に十分な速さを備えており、従来の運転用言語モデルと比べて約3倍低いレイテンシを達成し、nuPlan Test14-HardおよびInterPlanにおいて学習ベースの新たな最先端（state of the art）を確立する。さらに、PDM-Closedの構造的な制限に対処することを目的としたルールベースのプランナーであるRADも導入する。RADは、nuPlan Test14-HardおよびInterPlanにおいて、ルールベースのプランナーの中で最先端の性能を達成する。最後に、RADとLADを組み合わせることで、両アプローチの長所を取り込むハイブリッド計画が可能になることを示す。このハイブリッドシステムは、ルールと学習が相補的な能力を提供することを示している。すなわち、ルールは信頼性の高い操舵（マヌーバ）を支え、言語は適応的で説明可能な意思決定を可能にする。