InfoChess:敵対的推論のゲームと、定量的な情報制御のための実験場

arXiv cs.AI / 2026/4/20

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • この論文では、捕獲よりも情報獲得を主目的とする対称的な敵対ゲーム「InfoChess」を提案しています。
  • 持ち駒の捕獲をなくし、手を通じて視界(可視性)を変える仕組みにすることで、情報の影響を切り分けつつ、相手のキング位置の確率推定に基づいてスコア化できます。
  • 著者らは、相手モデリングの強さを段階的に高めたヒューリスティックなエージェントの基準群を示し、強化学習エージェントを学習してそれらを上回ることを報告しています。
  • ゲーム進行を、信念エントロピー、オラクル交差エントロピー、行動に誘発される観測チャネルに基づく予測対数スコアなどの情報理論的指標で分析し、認識論的不確実性・キャリブレーションの不一致・敵対的な移動による不確実性を分解します。
  • InfoChessは、部分可観測性下でのマルチエージェント推論を研究するためのテストベッドであるとしており、環境とエージェントのコードおよび公開インターフェースも提供します。

Abstract

本稿では、競争的な情報獲得を主要な目的へと引き上げる対称的な敵対ゲームとしてInfoChessを提案する。駒の捕獲は存在せず、情報の役割を混乱させてしまう可能性のある物質的な動機を取り除いている。その代わり、駒は視認性を変化させるために用いられる。プレイヤーは、ゲーム期間中の相手のキングの位置に関する確率的推論に基づいてスコア付けされる。InfoChessをプレイするための戦略の空間を探究するために、相手モデリングのレベルを段階的に高めるヒューリスティックエージェントの階層を導入し、それらを上回る強化学習エージェントを訓練する。ゲームの離散的な構造を活用し、信念エントロピー、オラクル交差エントロピー、行動が生む観測チャネルにおける予測ログスコアを含む、自然な情報理論的特徴づけによってゲームプレイを解析する。これらの指標は、認識論的な不確実性、キャリブレーションの不一致、敵対的な移動によって誘発される不確実性を切り分ける。InfoChessの設計により、部分観測下におけるマルチエージェント推論を研究するためのテストベッドが実現される。環境とエージェントのコード、および公開インターフェースを提供し、さらなる研究を促す。