要旨: 自律走行車(AV)のための、多エージェントの連合強化学習に基づく優先度を考慮したインテリジェントな車線変更アドバイザリシステム、すなわちPALCASを提案します。既存の車線変更アプローチは、一般に単一エージェントシステムまたは中央集権型の多エージェントシステムに焦点を当てていますが、本研究では、車両の目的地への到達緊急度に基づいて車線変更を優先する、連合強化学習ベースの多エージェント車線変更システムを導入します。PALCASは、必須の状況および裁量のある状況の両方において、慎重な車線変更判断を可能にする新しい優先度を考慮した安全な車線変更報酬関数を組み込みます。PALCASは、エージェント間の効果的な協調を促進するために、パラメータ化された深層Qネットワーク(PDQN)アルゴリズムを活用し、AVの横方向および縦方向の運動制御の両方を可能にします。SUMO交通シミュレータおよびMosaic V2X通信フレームワークを用いて実施した大規模なシミュレーションにより、PALCASは、ベースライン手法と比較して交通効率、走行安全性、快適性、目的地到着率、ならびに合流成功率を大幅に向上させることを示します。
PALCAS:連合強化学習と優先度認識に基づく自動運転車のための優先度対応知能レーンチェンジ助言システム
arXiv cs.RO / 2026/5/1
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、単一エージェントや中央集権型マルチエージェントではなく、多エージェントの連合強化学習を用いる自動運転車向けの優先度対応レーンチェンジ助言システムPALCASを提案する。
- PALCASは目的地の緊急度に基づいてレーンチェンジを優先付けし、必須・任意の両方の状況で適切な判断を可能にする「優先度認識の安全なレーンチェンジ報酬関数」を導入する。
- PDQN(パラメータ化深層Qネットワーク)アルゴリズムを用いてエージェント間の協調を高め、横方向(車線位置)と縦方向(速度/車間)の両方の制御を扱える。
- SUMO交通シミュレータとMosaic V2X通信フレームワークでの広範なシミュレーションにより、PALCASがベースライン手法と比べて交通効率、安全性、快適性、目的地到達率、合流成功率などを大きく改善することを示す。
- 本研究はarXivの新規投稿として提示されており、配備された製品というより研究段階の貢献である。




