協調的プロファイルは、科学ワークフローにおけるマルチエージェントLLMチームの性能を予測する

arXiv cs.CL / 2026/4/23

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本研究では、協調の仕組みを分離できる行動経済学の6つのゲームに35のオープンウェイトLLMを参加させ、共有制約下での協調行動を評価する。
  • ゲームから得られる「協調的プロファイル」は、LLMエージェントがAI for Scienceのワークフローで協働する際の性能を、強くかつ頑健に予測できることが示される。
  • とりわけ、ゲーム内での協調的な連携がうまく、チーム成果を増幅させる乗法的(multiplicative)な戦略を選ぶモデルは、貪欲(greedy)戦略よりも科学レポートの作成において優れていた。
  • この関連性は複数の要因を調整した後も維持され、協調性は一般的な能力に還元できない、測定可能なLLMの固有特性であることが示唆される。
  • 著者らは、行動経済学ゲームを用いて高価なマルチエージェント導入の前に協調的な適性を素早く低コストにスクリーニングできる診断手法として提案している。