LATS:交通信号制御におけるマルチエージェント強化学習のための、教師・学生フレームワークを用いた大規模言語モデル支援手法
arXiv cs.RO / 2026/3/26
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、学習済みの埋め込み型LLMとマルチエージェント強化学習を組み合わせた適応的交通信号制御のための、教師・学生フレームワークLATSを提案する。
- 交差点のトポロジーや交通ダイナミクスを捉える豊かな意味論的潜在特徴を生成するために、LLM教師を用いることで、従来のMARL手法の限界に対処する。
- 次に、小型の学生ニューラルネットワークを潜在空間での知識蒸留によって教師の特徴を模倣するように学習し、RL制御の推論時にはLLMを不要にする。
- 複数の交通データセットでの実験により、表現能力の向上が示され、従来のRLやLLMのみを用いるベースラインと比べて、より良い性能と強い汎化性能が得られる。
- 主要な考え方は、LLMの推論・意味論的事前知識を活用しつつ、蒸留によってLLMなしの学生コントローラへ移すことで、幻覚リスクと推論の遅さを緩和することである。