自動運転車におけるLLM対応マルチプランナースケジューリングによるオープンエンド命令の実現

arXiv cs.RO / 2026/4/10

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、旅客からのオープンエンドな自然言語による指示を解釈可能性と追跡可能性を保ったまま車両の操縦(マヌーバ)へと翻訳する方法に焦点を当て、自動運転HMI研究におけるギャップに取り組む。
  • LLMを活用した命令実現(instruction-realization)フレームワークを提案し、実時間のフィードバックに基づいて複数のMPCベースの運動(モーション)プランナをスケジューリングする実行可能スクリプトを生成する。
  • このアプローチは、異なる時間スケールにわたって、セマンティック推論と車両制御を分離し、高水準の指示から低水準の制御信号までの透明な意思決定の連鎖を構築する。
  • 高精度な評価ツールが不足していたため、著者らはクローズドループ環境におけるオープンエンド命令実現のベンチマークを提案する。
  • 実験では、ベースラインの命令実現手法より高いタスク完遂率が報告され、LLMへの問い合わせコストが削減され、安全性/コンプライアンスは専門的なAD手法と同等であること、さらにLLM推論遅延への頑健性も示される。

要旨: 自動運転(AD)における乗客の操縦ニーズは、ほとんどのヒューマン・マシン・インタラクション(HMI)研究で見落とされています。自然言語は直感的なインターフェースを提供しますが、乗客の自由形式の指示を、解釈可能性と追跡可能性を損なうことなく制御信号へと翻訳することは依然として課題です。本研究は、大規模言語モデル(LLM)を活用して指示を解釈し、リアルタイムのフィードバックに基づいて複数のモデル予測制御(MPC)ベースのモーションプランナをスケジュールする実行可能なスクリプトを生成し、計画された軌道を制御信号へ変換する、指示実現フレームワークを提案します。このスケジューリング中心の設計により、異なる時系列スケールにおいて意味推論と車両制御を切り離し、高レベルの指示から低レベルの行動に至る、透明で追跡可能な意思決定の連鎖を確立します。高精度な評価ツールが欠如しているため、本研究ではクローズドループ環境における自由形式指示実現のためのベンチマークを導入します。包括的な実験により、このフレームワークは指示実現のベースラインに比べてタスク完了率を大幅に向上させ、LLMの問い合わせコストを削減し、専用のAD手法と同等の安全性とコンプライアンスを達成し、さらにLLM推論遅延に対してかなりの耐性を示すことが明らかになりました。より定性的な説明と、より明確な理解のために。