DocSage: 複数文書・複数エンティティ問答のための情報構造化エージェント
arXiv cs.AI / 2026/3/13
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- DocSageは、動的スキーマ発見、構造化情報抽出、スキーマ認識型リレーショナル推論を統合した、複数文書・複数エンティティ問答をサポートするエンドツーエンドのエージェント型フレームワークです。
- このフレームワークは、標準的なRAGおよびグラフベースRAGが抱える限界を、正確な事実の局在化、文書横断のエンティティ結合、エラーを認識した抽出を可能にすることで解決します。
- 3つのコアモジュールから構成されています:(1)最小限の結合可能スキーマを推定するスキーマ発見モジュール、(2)テキストをエラー補正を施してリレーショナル表に変換する抽出モジュール、(3)構造化表上でのマルチホップリレーショナル推論を行う推論モジュール。
- 二つのMDMEQAベンチマークの評価において、DocSageは最先端の長文コンテキストLLMsおよびRAGシステムを大幅に上回り、それぞれ27%を超える精度向上を達成しました。
マルチドキュメント・マルチエンティティ質問応答は、本質的に、散在する複数の文書間で複数のエンティティ間の暗黙的な推論を追跡することを要求します。しかし、現状の大規模言語モデル(LLMs)および検索強化生成(RAG)フレームワークには重大な制約があります:標準的なRAGのベクトル類似度に基づく粗い検索はしばしば重要な事実を見落とし、グラフベースのRAGは分断された複雑な関係ネットワークを効率的に統合できず、さらにスキーマ認識能力が欠如しているため、文書間の証拠連鎖の構築が不十分で、エンティティ間の関係推定が不正確になります。これらの課題に対処するため、動的スキーマ発見、構造化情報抽出、スキーマ認識型リレーショナル推論をエラー保証とともに統合したエンドツーエンドのエージェント型フレームワークであるDocSageを提案します。DocSageは3つのコアモジュールを介して動作します:(1)クエリ特有の最小限の結合可能スキーマを動的に推定して重要なエンティティと関係を捉えるスキーマ発見モジュール、(2)未構造化テキストを意味的に整合性のあるリレーショナル表へ変換する抽出モジュールで、誤検出を抑制するエラー認識補正メカニズムを強化したもの、(3)構造化された表の上でマルチホップのリレーショナル推論を行い、スキーマ認識を活用して文書横断のエンティティを効率的に整合させ、証拠を集約する推論モジュール。このエージェント型設計は、SQLを活用したインデクシングによる正確な事実の局在化、リレーショナル表を通じた文書横断のエンティティ結合を自然にサポート、構造化表現によるLLMのアテンション分散の緩和という3つの主要な利点を提供します。二つのMDMEQAベンチマークでの評価は、DocSageが最先端の長文コンテキストLLMsおよびRAGシステムを著しく上回り、それぞれ27%以上の精度向上を達成したことを示しています。