CoordLight:ネットワーク全体の交通信号制御のための分散協調を学習する
arXiv cs.LG / 2026/3/26
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、分散環境での部分観測と協調の課題に着目し、ネットワーク全体の信号制御へ拡張可能なMARLフレームワーク「CoordLight」を提案しています。
- CoordLightでは、車両待ち行列モデルに基づく新しい状態表現「QDSE」により、各交差点エージェントが局所交通の動態を分析・予測して適切に応答できるようにしています。
- 協調学習のために、隣接エージェント間の状態・行動依存関係を注意機構で識別し、影響の大きい近隣との相互作用を優先する「Neighbor-aware Policy Optimization (NAPO)」を導入しています。
- 実データ3種類の交通ネットワーク(最大196交差点)で、既存の最先端信号制御手法に対して一貫して高い性能を示したと報告しています。
- 実装コードがGitHubで公開されており、研究者が再現・発展させやすい形で提供されています。