MARLからSARLへ:潜在コンセンサスによる順序不変マルチエージェント・トランスフォーマ
arXiv cs.AI / 2026/4/16
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、協調的MARLを階層的な単一エージェントの強化学習(SARL)定式化へと橋渡しする中央集権型アプローチであるConsensus Multi-Agent Transformer(CMAT)を提案する。Transformerを用いて大規模な同時観測(ジョイント観測)空間を扱うことで、MARLとSARLのギャップを埋める。
- CMATは自己回帰型Transformerデコーダにより、高レベルの潜在「コンセンサス」ベクトルを生成する。これにより、エージェントは順序に依存しない形でジョイントな意思決定を行え、従来の行動列に敏感なマルチエージェント・トランスフォーマに比べて頑健性が向上する。
- 潜在コンセンサスに条件付けすることで、同時に行うエージェントの行動を学習可能となり、協調した振る舞いを維持したまま単一エージェント向けPPO(Proximal Policy Optimization)によるジョイントな方策最適化を可能にする。
- StarCraft II、Multi-Agent MuJoCo、Google Research Footballでの実験により、CMATが近年の中央集権型手法、逐次型MARLアプローチ、標準的なMARLベースラインを上回ることが示される。
- 著者らは、公開GitHubリポジトリにてCMATのオープンソース実装を提供しており、再現やさらなる実験を容易にしている。




