AgentSwing：長期ホライズンWebエージェントのための適応的並列コンテキスト管理ルーティング

arXiv cs.CL / 2026/3/31

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、長期ホライズンのWebエージェントにおける主要なボトルネックである、有限なLLMコンテキスト容量に取り組む。既存手法では、軌跡全体に対して固定（非適応）のコンテキスト管理戦略が用いられている。
長期ホライズンの成功を、2つの次元――検索効率と終端の精度――を用いて形式化する確率論的枠組みを提案し、コンテキスト戦略をより適切に分析できるようにする。
提案手法のAgentSwingは、複数のコンテキスト管理されたブランチを並列に展開し、トリガーとなるポイントでルックアヘッド・ルーティングによって有望な継続を選択することで、状態に応じた適応的な並列コンテキスト管理ルーティングを実行する。
複数のベンチマークとエージェント基盤（バックボーン）に対する実験により、AgentSwingは強力な静的コンテキスト管理のベースラインを上回ることが示される。多くの場合、最大3×少ないインタラクション手数で同等以上の性能を達成し、最終的なWebエージェント性能の上限を押し上げる。

要旨: 大規模言語モデル（LLM）が、長い地平線にわたる情報探索の自律エージェントへと進化するにつれ、有限のコンテキスト容量を管理することが重要なボトルネックとなっています。既存のコンテキスト管理手法は通常、軌跡全体を通して単一の固定戦略にコミットします。このような静的設計は一部の状態ではうまく機能するかもしれませんが、長い地平線での探索中に、蓄積されたコンテキストの有用性と信頼性が変化していくにつれて、その有効性に適応することはできません。この課題を形式化するために、長期的な成功を、補完的な2つの次元──探索効率と終端の精度──によって特徴づける確率的枠組みを導入します。この観点に基づき、状態を認識した適応的並列コンテキスト管理ルーティングの枠組みであるAgentSwingを提案します。各トリガー時点で、AgentSwingは複数のコンテキスト管理ブランチを並列に展開し、先読みルーティングによって最も有望な継続を選択します。多様なベンチマークおよびエージェントのバックボーンにまたがる実験の結果、AgentSwingは一貫して強力な静的コンテキスト管理手法を上回り、しばしば最大で $3\times$ 少ないインタラクション手数で同等、あるいはそれ以上の性能を達成することに加え、長い地平線のウェブエージェントにおける最終的な性能上限も改善します。経験的な利得にとどまらず、提案する確率的枠組みは、長期エージェントのための今後のコンテキスト管理戦略を分析し設計するための、原理に基づくレンズを提供します。