Web2BigTable:インターネット規模の情報検索と抽出のためのバイレベル・マルチエージェントLLMシステム

arXiv cs.AI / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • Web2BigTableは、深い推論(単一ターゲット)と広い構造化抽出(多数のエンティティや異種ソース)を両立するための、バイレベルのマルチエージェントLLMフレームワークです。
  • 上位のオーケストレータがタスクを分解し、下位のワーカーエージェントがサブ問題を並列に実行する仕組みを採用し、共有ワークスペースによって部分的な発見を可視化して重複探索を減らします。
  • run–verify–reflect(実行–検証–省察)のクローズドループにより、永続的で人間が読める外部メモリを用いて反復ごとに分解と実行を改善し、各エージェントの挙動も自己進化させます。
  • WideSearchで新たな最先端(Avg@4成功率 38.50、Row F1およびItem F1で大幅な上積み)を達成し、XBench-DeepSearchでも深い探索に対して73.0の精度で高い汎化を示しています。
  • GitHub上でコードが公開されており、導入や追加実験を進められるようになっています。

Abstract

エージェント型のWeb検索は、ますます2つの異なる要求に直面しています。すなわち、単一の対象に対する深い推論と、多数のエンティティや異種ソースにまたがった構造化された集約です。現在のシステムは両方の面で苦戦しています。幅重視のタスクでは、スキーマに整合した出力であって、広いカバレッジとエンティティ間の一貫性を備えることが求められます。一方、深さ重視のタスクでは、長く分岐する探索の軌跡にわたって首尾一貫した推論を行う必要があります。私たちは、両方のレジームを支援するウェブからテーブルへの検索のためのマルチエージェントフレームワークである\textbf{Web2BigTable}を提案します。Web2BigTableは、上位レベルのオーケストレータがタスクをサブ問題へ分解し、下位レベルのワーカエージェントがそれらを並列に解決する、二層(バイレベル)アーキテクチャを採用します。クローズドループの実行—検証—省察(run--verify--reflect)プロセスを通じて、このフレームワークは、永続的で人間が読める外部メモリと、各単一エージェントごとの自己進化的な更新によって、分解と実行を時間の経過とともに共同で改善します。実行中、ワーカは共有ワークスペースを通じて調査の途中結果を可視化し合うことで、重複した探索を減らし、衝突する証拠を突き合わせて整合させ、出現しつつあるカバレッジの欠落に適応できます。Web2BigTableはWideSearchにおいて新たな最先端を達成し、Avg@4 Success Rateが\textbf{38.50}(2番手の5.10に対して7.5\times)、Row F1が\textbf{63.53}(2番手を+25.03上回る)、Item F1が\textbf{80.12}(2番手を+14.42上回る)となりました。また、XBench-DeepSearchにおける深さ重視の探索にも汎化し、精度73.0を達成しています。コードはhttps://github.com/web2bigtable/web2bigtableで公開しています。