CROSS:一般化可能な大規模交通信号制御のためのMixture-of-Experts(MoE)強化学習フレームワーク

arXiv cs.RO / 2026/3/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、多様な大規模交差点のトポロジと交通パターンにわたって一般化できる適応的な交通信号制御のための、分散型強化学習フレームワーク「CROSS」を提案する。
  • CROSSはMixture-of-Experts(MoE)の手法を用い、共有ポリシーに加えて複数のシナリオに適応するエキスパートを組み合わせることで、単一ポリシーの強化学習手法よりも交通ダイナミクスの変動をより良く捉える。
  • 短期的な状態遷移を予測するPredictive Contrastive Clustering(PCC)モジュールを導入し、クラスタリングとコントラスト学習によって、より頑健なパターンレベルの表現を形成する。
  • SUMOシミュレータ上で、合成データと実世界データの両方を用いた実験により、CROSSは制御性能と新しいシナリオへの一般化の両面で、最先端のベースラインよりも優れていることを示す。