共通ノイズを伴うマルチエージェント系における平均場ゲームでの人口（集団）を考慮したイミテーション学習

arXiv cs.LG / 2026/5/6

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、平均場ゲーム（MFG）におけるイミテーション学習を扱い、エージェントが共通ノイズに直面し、人口分布が確率的に変化する状況を考えます。
共通ノイズによる確率性のため、集団レベルのショックに応答できる「人口（集団）を考慮した」方策が必要だと主張しています。
学習目的として「ナッシュ均衡の回復」と「専門家集団に対する性能最大化（専門家との一致・上回り）」の2つを定式化し、代理損失として行動クローン（BC）と敵対的ダイバージェンス（ADV）を検討します。
さらに、これらの代理損失を最小化することで、方策の搾取可能性（exploitability）と専門家との差（性能ギャップ）の両方を有限サンプルの誤差評価により制御できることを示します。
一般化フィクティシャス・プレイと深層学習を組み合わせた数値計算の枠組みを提案し、3つの環境で、人口を考慮しない通常の方策では共通ノイズ下の均衡ダイナミクスを捉えられないことを実験で示しています。

日経XTECH

Dev.to

Dev.to

MarkTechPost

MarkTechPost