SODIUM: オープンウェブデータを照会可能なデータベースへ

arXiv cs.CL / 2026/3/20

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisTools & Practical UsageModels & Research

共有:

要点

本論文はSODIUMタスクを形式化し、オープンウェブを下流のクエリ処理を支えるために実体化されなければならない潜在データベースとして概念化する。
SODIUM-Benchは、6ドメインにわたる105のタスクから成るベンチマークであり、ウェブデータを構造化された表へ自動探索・統合する能力を評価する。
本研究は、既存のAIエージェントがSODIUM-Benchで苦戦することを示す（最良のベースラインは約46.5%の精度）、一方でSODIUM-Agentは91.1%の精度を達成し、強力なベースラインをほぼ2倍にする。
SODIUM-Agentは、ウェブエクスプローラとキャッシュマネージャからなるマルチエージェントシステムであり、深い探索と一貫した情報抽出を可能にするATP-BFSアルゴリズムによって推進される。

要旨: 研究の過程で、分野の専門家はしばしば、さまざまなウェブソースからデータを統合する回答を要する分析的な問いを抱くことがあります。したがって、分析を開始する前に、生データを検索・抽出・整理するにはかなりの労力を要します。私たちはこの過程をSODIUMタスクとして形式化します。ウェブのようなオープンドメインを、下流の照会を支援するために体系的に具体化されなければならない潜在データベースとして概念化します。SODIUMを解くには (1) オープンウェブの深く専門的な探索を実施すること、(2) 構造的相関を活用して体系的な情報抽出を行うこと、(3) 収集した情報を一貫した、照会可能なデータベースインスタンスへ統合すること、が必要です。

SODIUMの自動化の課題を定量化するために、SODIUM-Benchを構築します。6つのドメインにわたる公開された学術論文から派生した105件のタスクのベンチマークで、システムはオープンウェブを探索して、さまざまなソースからデータを収集・統合し、構造化された表へ整理する任務を課されます。既存のシステムはSODIUMタスクに苦戦します。SODIUM-Bench上で6つの高度なAIエージェントを評価し、最も強力なベースラインでさえ46.5%の精度にとどまります。ギャップを埋めるために、ウェブ探索者とキャッシュマネージャーからなるマルチエージェントシステムであるSODIUM-Agentを開発します。提案したATP-BFSアルゴリズムにより推進され、キャッシュ済みソースとナビゲーション経路の原理的な管理を通じて最適化されたSODIUM-Agentは、深く包括的なウェブ探索を実行し、構造的に整合性のある情報抽出を行います。SODIUM-AgentはSODIUM-Benchで91.1%の精度を達成し、最も強力なベースラインを約2倍、最も弱いものを最大で73倍上回ります。

Translator

Azure OpenAI Service ドキュメント

200人のChatGPTユーザーに聞いた最大の不満。トップ5はすべてChatGPT Toolboxが解決する問題だった。

Reddit r/artificial

すべてのPRをセキュリティバグでレビューするAIを作った — その方法（2026）

Dev.to

[R] アイデンティティ・アンカーと権限階層の組み合わせが abliterated LLMs で 100% の拒否を実現 — システムプロンプトのみ、ファインチューニングなし

Reddit r/MachineLearning

私がリードを見つけ、個別化されたコールドメールを作成するAI SDRエージェントを構築した方法

Dev.to

SODIUM: オープンウェブデータを照会可能なデータベースへ

要点

関連記事

Translator

200人のChatGPTユーザーに聞いた最大の不満。トップ5はすべてChatGPT Toolboxが解決する問題だった。

すべてのPRをセキュリティバグでレビューするAIを作った — その方法（2026）

[R] アイデンティティ・アンカーと権限階層の組み合わせが abliterated LLMs で 100% の拒否を実現 — システムプロンプトのみ、ファインチューニングなし

私がリードを見つけ、個別化されたコールドメールを作成するAI SDRエージェントを構築した方法

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer