MARL-GPT:マルチエージェント強化学習のための基盤モデル
arXiv cs.AI / 2026/4/8
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、複数のマルチエージェント強化学習(MARL)環境およびタスクに対して、タスク固有のアーキテクチャではなく単一のモデルで学習し実行するための、GPTベースの基盤モデルであるMARL-GPTを提案する。
- MARL-GPTは、大規模なエキスパート軌跡によるオフライン強化学習で訓練され(SMACv2で400M、GRFで100M、POGEMAで1B)、タスク固有のチューニングを回避する単一のトランスフォーマー型観測エンコーダを用いる。
- 実験の結果、MARL-GPTは、StarCraft Multi-Agent Challenge、Google Research Football、POGEMAを含む検証ベンチマークにおいて、専門的なMARLベースラインに対して競争力のある性能を示す。
- 著者らは、このアプローチが、LLMがNLPタスクにまたがって汎化するのと同様に、著しく異なるマルチエージェント問題設定に対して一般化する「基盤」型のMARLモデルというより大きな目標を支えると主張している。




