AI Navigate

リソース制約下のアマゾンズのチェス決定フレームワーク:大規模言語モデルとグラフアテンションの統合

arXiv cs.AI / 2026/3/12

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、アマゾンズのチェスのためのリソース制約環境で動作するよう、Graph Attention Autoencoder、Monte Carlo Tree Search、Stochastic Graph Genetic Algorithm、そしてGPT-4o-miniを組み合わせた軽量ハイブリッドフレームワークを提案します。
  • グラフアテンションオートエンコーダを活用して多段階のモンテカルロ木探索を導入し、評価信号を最適化するために確率的グラフ遺伝アルゴリズムを用い、GPT-4o-miniが合成トレーニングデータを生成します。
  • グラフアテンション機構は構造的フィルターとして機能し、LLMの出力をノイズ除去して意思決定の質を向上させます。
  • 10×10のアマゾンズ盤での実験は、ベースラインに対して意思決定の精度を15%〜56%改善し、低ノード数でも競争力のある勝率を示すことで、厳しいリソース環境下で基盤モデルから高性能なゲームAIを進化させる実現可能性を示しています。

要旨:
人工知能は、知的なゲームプレイシステムの開発を通じて大きく前進し、意思決定、戦略計画、適応学習の厳格な検証基盤を提供してきました。しかし、リソース制約環境は重大な課題を提起します。従来の深層学習手法は広範なデータセットと計算資源に大きく依存します。本稿では、アマゾンズのチェスのための軽量ハイブリッドフレームワークを提案します。グラフベースの学習による構造推論と大規模言語モデルの生成能力を統合することで、弱いから強い一般化へと至るパラダイムを探究します。具体的には、グラフアテンションオートエンコーダを用いて多段階のモンテカルロ木探索を導き、確率的グラフ遺伝アルゴリズムを用いて評価信号を最適化し、GPT-4o-miniを活用して合成トレーニングデータを生成します。従来のアプローチのように専門家のデモンストレーションに依存するのではなく、私たちのフレームワークはノイズの多い不完全な監視から学習します。グラフアテンション機構は、構造的フィルターとして効果的に機能し、LLMの出力のノイズを除去します。10×10のアマゾンズ盤での実験は、私たちのハイブリッドアプローチがベースラインに対して意思決定の精度を15%〜56%改善するだけでなく、教師モデル(GPT-4o-mini)を大幅に上回り、N=30ノードで45.0%の勝率、N=50ノードで66.5%の勝率を達成します。これらの結果は、厳格な計算資源制約の下で、一般用途の基盤モデルから専門化された高性能なゲームAIを進化させることの実現可能性を検証します。