要旨: ゲーム理論に基づく計画フレームワークは、多主体間の相互作用をモデル化するのに有効である一方で、変数の数がエージェント数に比例して増加する大規模な最適化問題を解く必要があり、その結果として計算時間が長くなってしまうため、大規模かつリアルタイムなシステムでの利用が制限されます。この問題に対処するために、1) PSN Game-a 学習ベースのゲーム理論的予測および計画フレームワークを提案します。これは、プレイヤー選択ネットワーク(PSN)を学習することでゲームのサイズを縮小します。加えて、2) 目標推論ネットワーク(GIN)を導入し、他のエージェントの意図が自我エージェントに不明である不完全情報ゲームにおいても PSN を用いることを可能にします。PSN は、影響の大きいプレイヤーとそれほど関連のないプレイヤーを区別するプレイヤー選択マスクを出力し、それによって自我プレイヤーは選択されたプレイヤーのみを含む、より小さなマスク付きゲームを解くことができます。ゲームに含まれるプレイヤー数を減らすことで、PSN は対応する最適化問題を縮小し、その結果、解法時間が短くなります。模擬シナリオと現実世界の歩行者軌跡データセットの両方における実験により、PSN は、1) 予測精度および2) 計画の安全性の観点で評価した明示的なゲーム理論的選択のベースラインと競合し、しばしばそれを上回ることが示されました。さまざまなシナリオにおいて、PSN は通常、完全なゲームに存在する全プレイヤーよりも実質的に少ない数のプレイヤーを選択するため、ゲームサイズと計画の複雑性が低減されます。また PSN は、GIN により、テスト時の微調整なしに、エージェントの目的が未知である設定へも汎化します。意思決定に最も関連のあるプレイヤーだけを選択することで、PSN Game は、既存のマルチエージェント計画フレームワークに統合可能な、計画の複雑性を低減する実用的なメカニズムを提供します。
スケーラブルなゲーム理論的予測と計画のためのプレイヤー選択ネットワーク
arXiv cs.RO / 2026/4/2
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、影響の小さいエージェントをマスクして除外するためのプレイヤー選択ネットワーク(PSN)を学習することで、マルチエージェント計画の複雑性を低減する学習ベースのゲーム理論的予測・計画フレームワーク「PSN Game」を提案する。
- プレイヤー選択ネットワークは選択マスクを出力し、エゴエージェントが選択されたプレイヤーのみを対象としてより小さな最適化問題を解くことで、スケーラブルでリアルタイムな状況での計算を高速化する。
- 他エージェントの意図が不明なために生じる不完全情報の状況に対応するため、著者らは目標推論ネットワーク(GIN)を追加し、PSNがテスト時の微調整なしで動作できるようにする。
- シミュレーション環境および実世界の歩行者軌跡データセットでの実験により、PSNが予測精度と計画の安全性の両面で、ベースラインとなるゲーム理論的な選択手法と同等であり、しばしば改善することが示される。
- 本手法は通常、全ゲームに存在するプレイヤーのうち非常に少数しか選択しないため、既存のマルチエージェント計画パイプラインに統合しつつ、条件をまたいで一般化できることが示唆される。


