LLMが生成するグラフ・プライアはマルチエージェント協調を改善できるか？

arXiv cs.LG / 2026/4/21

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

この論文は、LLM（大規模言語モデル）が観測の最小限の自然言語記述から、マルチエージェント強化学習（MARL）の協調用グラフ・プライアを生成できるかを検証します。
LLM由来のプライアは、GNN（グラフニューラルネット）ベースのパイプライン内でグラフ畳み込み層としてMARLに組み込み、エージェントの協調の指針とします。
MPE（Multi-Agent Particle Environment）の4つの協調シナリオで、独立学習から最先端のグラフベース手法まで幅広いベースラインに対して定量的な改善が示されます。
比較では、比較的小規模なオープンソースLLMでも有効であり、1.5Bパラメータ規模のモデルでも効果的なプライア生成が可能だと示唆されます。
複数のコンパクトLLMに対するアブレーションにより、生成されるプライア品質がモデル選択にどれほど依存するかを評価します。

要旨: 多エージェント強化学習（MARL）は、分散的かつ敵対的な状況で協調して動作するAIシステム、特にマルチドメイン運用（MDO）において重要である。協調MARLにおける中心的課題は、エージェントがどのように連携すべきかを決定することである。既存の手法は、いずれもグラフのトポロジーを人手で指定するか、近接ベースのヒューリスティックに依存するか、あるいは環境との相互作用から構造を完全に学習するかのどれかに限られている。これらはいずれも脆弱で、意味的に情報が乏しく、あるいはデータを大量に要する。本研究では、エージェントの観測を最小限の自然言語記述で用いることで、潜在的な連携パターンを推論し、大規模言語モデル（LLM）がMARLのための有用な協調グラフ事前分布（prior）を生成できるかを調べる。これらのpriorは、GNN（グラフニューラルネットワーク）ベースのパイプライン内にあるグラフ畳み込み層を通じてMARLアルゴリズムに統合され、Multi-Agent Particle Environment（MPE）ベンチマークの4つの協調シナリオにおいて、独立学習者から最先端のグラフベース手法まで、協調モデリングの全スペクトルにわたるベースラインに対して評価する。さらに、5つのコンパクトなオープンソースLLMにわたってアブレーションを行い、priorの品質がモデル選択にどれほど敏感かを評価する。本結果は、動的なマルチエージェント環境において、LLM由来のグラフ事前分布が連携と適応性を高め得ることを示す最初の定量的な証拠を提供し、また、パラメータ数が1.5Bのように小さいモデルでも効果的なprior生成に十分であることを示している。