要旨: 研究の過程で、分野の専門家はしばしば、さまざまなウェブソースからデータを統合する回答を要する分析的な問いを抱くことがあります。したがって、分析を開始する前に、生データを検索・抽出・整理するにはかなりの労力を要します。私たちはこの過程をSODIUMタスクとして形式化します。ウェブのようなオープンドメインを、下流の照会を支援するために体系的に具体化されなければならない潜在データベースとして概念化します。SODIUMを解くには (1) オープンウェブの深く専門的な探索を実施すること、(2) 構造的相関を活用して体系的な情報抽出を行うこと、(3) 収集した情報を一貫した、照会可能なデータベースインスタンスへ統合すること、が必要です。
SODIUMの自動化の課題を定量化するために、SODIUM-Benchを構築します。6つのドメインにわたる公開された学術論文から派生した105件のタスクのベンチマークで、システムはオープンウェブを探索して、さまざまなソースからデータを収集・統合し、構造化された表へ整理する任務を課されます。既存のシステムはSODIUMタスクに苦戦します。SODIUM-Bench上で6つの高度なAIエージェントを評価し、最も強力なベースラインでさえ46.5%の精度にとどまります。ギャップを埋めるために、ウェブ探索者とキャッシュマネージャーからなるマルチエージェントシステムであるSODIUM-Agentを開発します。提案したATP-BFSアルゴリズムにより推進され、キャッシュ済みソースとナビゲーション経路の原理的な管理を通じて最適化されたSODIUM-Agentは、深く包括的なウェブ探索を実行し、構造的に整合性のある情報抽出を行います。SODIUM-AgentはSODIUM-Benchで91.1%の精度を達成し、最も強力なベースラインを約2倍、最も弱いものを最大で73倍上回ります。