CROSS:一般化可能な大規模交通信号制御のためのMixture-of-Experts(MoE)強化学習フレームワーク
arXiv cs.RO / 2026/3/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文では、多様な大規模交差点のトポロジと交通パターンにわたって一般化できる適応的な交通信号制御のための、分散型強化学習フレームワーク「CROSS」を提案する。
- CROSSはMixture-of-Experts(MoE)の手法を用い、共有ポリシーに加えて複数のシナリオに適応するエキスパートを組み合わせることで、単一ポリシーの強化学習手法よりも交通ダイナミクスの変動をより良く捉える。
- 短期的な状態遷移を予測するPredictive Contrastive Clustering(PCC)モジュールを導入し、クラスタリングとコントラスト学習によって、より頑健なパターンレベルの表現を形成する。
- SUMOシミュレータ上で、合成データと実世界データの両方を用いた実験により、CROSSは制御性能と新しいシナリオへの一般化の両面で、最先端のベースラインよりも優れていることを示す。




