競って勝つために協力する:複数のエージェントによる征服における戦略的協調

arXiv cs.CL / 2026/4/29

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は「Cooperate to Compete(C2C)」を提案し、LMベースのエージェントが非対称な秘密目標のもとで、短期の協力と長期の競争目標を組み合わせて達成を目指すマルチエージェント環境を示しています。
  • C2Cでは交渉が非拘束であるため、インセンティブが変化することで同盟が形成・解消され、現実に近い混合動機の協調状況を作り出します。
  • 人間とLMの交渉行動を比較した結果、人間はより低複雑度の取引を好む一方でパートナーとしての信頼性が低く、対案なしで提案を受け入れる割合も低いことが分かります(56.3% vs. 67.6%)。
  • これらの行動差に基づく示唆を用いたプロンプトで交渉戦略を調整し、勝率を22.2%から32.7%へ改善したと報告しています。
  • 1,100回超のゲーム、16,000件超の非公開会話、15.2Mトークン規模のデータを通じて、C2Cを実運用に必要な高度な協調を扱えるLMエージェントの評価・構築用テストベッドとして位置づけています。

要旨: 言語モデル(LM)ベースのエージェントは、エージェントが長期的な競争目標のために短期的な協力を活用しなければならない混合動機の状況(例:多者間の政治)において、ほとんど検証されていません。私たちは、Cooperate to Compete(C2C)を提案します。これはマルチエージェント環境であり、プレイヤーは自分たちの秘密の目的を最初に達成することを競い合いながら、私的な交渉に関与できます。プレイヤーの目的は非対称であり、交渉は拘束力を持ちません。そのため、プレイヤー間の短期的な利害が一致したり食い違ったりすることで、同盟が形成されたり解消されたりします。私たちはAIのみの対戦を実施し、人間のプレイヤーがAI相手と対戦するユーザースタディも行いました。人間とAIの交渉行動の間には重要な違いがあることを特定し、人間は複雑性の低い取引を好む一方、LMベースのエージェントに比べて有意に信頼性の低いパートナーであることを示します。また、人間はより攻撃的な交渉者であり、対案を出さずに取引を受け入れるのは56.3%の確率にとどまるのに対し、LMベースのエージェントは67.6%でした。これらの知見に着想を得た的を絞ったプロンプトにより、エージェントの交渉行動を修正し、勝率を22.2%から32.7%へと改善しました。15.2百万トークンに相当する15万件以上の総計を含む16,000を超える私的な会話と、150,000を超えるプレイヤー行動を伴う1,100以上のゲームを実施しました。私たちの結果は、C2Cを、実世界での導入に必要とされる高度な調整を切り抜けられるLMベースのエージェントを研究し構築するためのテストベッドとして確立するものです。ゲーム、コード、データセットは https://negotiationgame.io/c2c で見つけられます。