汎用LLMを人間のドライバー行動のモデルとして:簡略化された合流の事例

arXiv cs.AI / 2026/4/14

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、仮想的なAV(自動運転車)安全性評価に用いられる簡略化した1Dの合流シナリオにおいて、汎用目的のLLMが人間のドライバー行動の単独モデルとして機能し得るかを評価する。
  • 2つのクローズドループ型のLLMドライバー・エージェント(OpenAI o3とGoogle Gemini 2.5 Pro)を埋め込み、定量的/定性的な挙動を人間の運転データと比較する。
  • LLMは、断続的な操舵(制御)のような人間らしい特性や、空間的手がかりに対する戦術的依存といった特徴を一部再現する。
  • しかし、両モデルはいずれも動的な速度に関する合図への人間の応答を一貫して捉えられず、その結果、安全性能が人間データと比べて大きく乖離する。
  • プロンプトのアブレーション(要素除去)研究により、プロンプト要素はモデル固有の帰納バイアスとして働き、LLM間では転移しないことが示される。これにより、移植性の限定と、妥当性/失敗モード上の重要な懸念が浮き彫りになる。

要旨: 人間の行動モデルは、行動の参照として、また自動運転車(AV)の仮想的な安全性評価において人間エージェントをシミュレートするために不可欠である。しかし、現在のモデルには、解釈可能性と柔軟性の間にトレードオフが存在する。汎用の大規模言語モデル(LLM)は有望な代替手段を提供する。すなわち、単一のモデルを、パラメータ調整なしで多様な状況にわたって展開できる可能性がある。とはいえ、LLMが人間の運転行動について何をどこまで捉えられるのか、また捉えられないのかは、いまだ十分に理解されていない。本研究は、このギャップを埋めるために、2つの汎用LLM(OpenAI o3およびGoogle Gemini 2.5 Pro)を、簡略化した一次元の合流シナリオにおける単独のクローズドループ車両運転エージェントとして埋め込み、それらの挙動を定量的および定性的分析によって人間のデータと比較する。両モデルはいずれも、人間に類似した断続的な運転操作と、空間的手がかりに対する戦術的依存関係を再現する。しかし、動的な速度の手がかりに対する人間の応答を、いずれも一貫して捉えられていない。また、安全性の性能はモデル間で大きく乖離する。系統的なプロンプトのアブレーション(要素除去)研究により、プロンプト要素が、モデル固有の帰納的バイアスとして機能し、LLM間では転移しないことが明らかになった。これらの結果は、汎用LLMがAV評価パイプラインにおいて、単独の、すぐに使用可能な人間行動モデルとして機能し得ることを示唆するが、今後の研究により失敗モードをよりよく理解し、人間の運転行動モデルとしての妥当性を確実にする必要がある。

汎用LLMを人間のドライバー行動のモデルとして:簡略化された合流の事例 | AI Navigate