InfoSeeker:Web情報探索のためのスケーラブルな階層型並列エージェント・フレームワーク

arXiv cs.AI / 2026/4/6

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • InfoSeeker は、多数の異種ソースにまたがるデータ集約型の統合を対象とした、Web情報探索のための階層型並列エージェント・フレームワークである。
  • この手法は、Host–Managers–Workers 構造を用い、Manager 層での集約とリフレクションによってコンテキストの隔離を強制し、コンテキストの飽和や連鎖的な誤り伝播を低減する。
  • Worker レベルでの並列性によりエンドツーエンドの実行が高速化され、多段のエージェント型検索システムに典型的な高遅延を緩和する。
  • WideSearch-en と BrowseComp-zh での実験では、それぞれ 3〜5× の速度向上に加え、成功率が 8.4%、精度が 52.9% であることが報告されており、効率性と有効性の両方が示されている。
  • 本論文はフレームワークを発表し、再現性とさらなる実験のために GitHub で公開コードも提供する。

Abstract

近年のエージェント型探索システムは、深い多段階推論を重視することで大きな進展を遂げてきました。しかし、この焦点は、エージェントが多数の情報源にわたって大量の異種な証拠を集約しなければならない、広範な情報統合に関する課題を見落としがちです。その結果、既存のほとんどの大規模言語モデルのエージェントシステムは、文脈飽和、エラーの連鎖的な伝播、エンドツーエンドの高い遅延といった、データ集約的な状況で重大な制約に直面しています。これらの課題に対処するため、私たちは ramework を提案します。これは、近分解可能性の原理に基づく階層型の枠組みであり、戦略的な extit{Host}、複数の extit{Managers}、そして並列な extit{Workers} を含みます。Manager 層で集約と省察のメカニズムを活用することで、文脈飽和とエラー伝播を防ぐための厳密な文脈隔離を強制します。同時に、Worker 層における並列性により、全体のタスク実行速度が向上し、大きな遅延を緩和します。相補的な2つのベンチマークでの評価により、本手法は効率性( 3-5 \times の高速化)と有効性の両方を示し、WideSearch-en で 8.4\% の成功率、BrowseComp-zh で 52.9\% の精度を達成しています。コードは https://github.com/agent-on-the-fly/InfoSeeker で公開されています