トークン効率の高い協調のためのフェーズスケジュール型マルチエージェントシステム

arXiv cs.AI / 2026/4/21

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • 本論文は、LLMベースのマルチエージェントシステムにおけるトークン効率の悪さを、同時起動(非構造)と関連性のない文脈共有の抑制という観点から解決するPhase-Scheduled Multi-Agent Systems(PSMAS)を提案する。
  • PSMASでは、各エージェントに円環状の注意空間上での固定位相を割り当て、グローバルなスイープ信号により小さな角度ウィンドウ内にあるエージェントのみを活性化し、待機中のエージェントには圧縮した文脈要約を与える。
  • LangGraph上で実装し、4つの構造化ベンチマークと2つの会話型設定で評価した結果、PSMASは平均27.3%のトークン削減を達成しつつ、完全活性化ベースラインとの差を2.1パーセントポイント以内に抑えた。
  • 著者らは、スイープダイナミクスに対する安定性・収束・最適性の理論結果を示し、トークン削減の主要因は位相スケジューリング単体(18〜20ポイント)であることを、圧縮品質の劣化(alpha=0.40まで)に対して頑健である点とともに示している。

要旨: 大規模言語モデルによって駆動されるマルチエージェントシステム(MAS)は、2つの複合的な要因に起因する重大なトークン効率の低下に悩まされています:(i)入力の準備状況にかかわらず、すべてのエージェントが同時に起動する非構造的な並列実行、そして(ii)無制限のコンテキスト共有により、関連性にかかわらずすべてのエージェントが蓄積された全コンテキストを受け取ることです。既存の緩和戦略――静的プルーニング、階層的分解、学習されたルーティング――は、協調を構造的な割り当て問題として扱うものであり、本質的にその時間的次元を無視しています。私たちは、位相スケジュール型マルチエージェントシステム(PSMAS)を提案します。この枠組みは、エージェントの起動を、円環多様体上でモデル化された共有注意空間に対する連続的な制御として再概念化します。
各エージェントiには、タスク依存関係のトポロジに基づいて、範囲[0, 2*pi]内の固定角度位相theta_iが割り当てられます。グローバルなスイープ信号phi(t)は速度omegaで回転し、角度ウィンドウepsilon内にあるエージェントのみを起動します。アイドル状態のエージェントには圧縮されたコンテキスト要約が与えられ、ステップあたりのトークン消費が削減されます。私たちはLangGraph上でPSMASを実装し、4つの構造化ベンチマーク(HotPotQA-MAS, HumanEval-MAS, ALFWorld-Multi, WebArena-Coord)と2つの非構造化会話設定で評価し、スイープダイナミクスに対する安定性、収束性、最適性の結果を証明します。PSMASは、タスク性能を完全に起動されたベースラインから2.1パーセンテージポイント以内に維持したまま(p < 0.01、各設定あたりn = 500)、平均トークン削減率27.3パーセント(範囲21.4-34.8パーセント)を達成します。また、トークン削減において最強の学習済みルーティングベースラインを5.6パーセンテージポイント上回り、性能低下は2.0パーセンテージポイント少なくなります。重要な点として、私たちはスケジューリングと圧縮は獲得(利得)の独立した原因であることを示します。スケジューリングのみで18-20パーセンテージポイントの削減が説明でき、圧縮の劣化がalpha = 0.40まで進んでも頑健です。