要旨: 都市交通制御は、交通信号、幹線道路(フリーウェイ)、公共交通、タクシーサービスなどの異種サブシステムにまたがるシステムレベルの協調問題である。既存の最適化ベース、強化学習(RL)、および新たに登場したLLMベースのアプローチは、主として独立したタスク向けに設計されているため、タスク間の汎化が制限され、さらにサブシステム間で結合した物理ダイナミクスを捉える能力も制限される。私たちは、有効なシステムレベル制御には、サブシステムがインフラ、移動需要、時空間の制約を共有する統一された物理環境が必要であると主張する。これにより、局所的な介入がネットワークを通じて伝播できるようになる。この目的のために、私たちは、統一ランタイム環境に基づく一般的な都市交通制御のためのフレームワーク「TrafficClaw」を提案する。TrafficClawは、異種サブシステムを共有される力学系へと統合し、サブシステム間相互作用を明示的にモデル化し、閉ループのエージェント—環境フィードバックを可能にする。この環境の中で、私たちは、実行可能な時空間推論と再利用可能な手続き型メモリを備えたLLMエージェントを開発し、サブシステム横断の統一的な診断と、継続的な戦略の改善を支援する。さらに、教師ありの初期化と、システムレベルの最適化を伴うエージェント型RLを組み合わせた多段階の学習パイプラインを導入し、協調されたシステムを意識した性能を一層可能にする。実験の結果、TrafficClawは、未見の交通シナリオ、ダイナミクス、タスク構成に対して、頑健で移転可能かつシステムを意識した性能を達成することを示した。私たちのプロジェクトは https://github.com/usail-hkust/TrafficClaw で公開されている。
TrafficClaw:統一された物理環境モデリングによる汎用的な都市交通制御
arXiv cs.AI / 2026/4/21
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、交通信号・高速道路・公共交通・タクシーなどの異種サブシステムを孤立したタスクとして扱うのではなく、統一された物理環境で結合して捉えることで、都市交通制御にはシステム全体としての一般化が必要だと主張しています。
- TrafficClawは、複数の交通サブシステムを共有する力学的な実行環境に統合し、サブシステム間の相互作用を明示的にモデル化するとともに、エージェントと環境の閉ループフィードバックを可能にします。
- TrafficClawでは、実行可能な時空間推論と再利用可能な手続き的メモリを備えたLLMエージェントを構築し、サブシステム横断の統一診断と戦略の継続的な改善を支援します。
- 多段階の学習パイプラインとして、教師あり初期化に加え、エージェント型強化学習とシステムレベル最適化を組み合わせ、協調的かつシステムを意識した性能を狙います。
- 実験では、未見の交通シナリオやダイナミクス、タスク構成に対しても堅牢で転用可能、かつシステムを意識した性能が示されたとされ、プロジェクトはGitHubで公開されています。



