DocSage: 複数文書・複数エンティティ問答のための情報構造化エージェント

arXiv cs.AI / 2026/3/13

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

DocSageは、動的スキーマ発見、構造化情報抽出、スキーマ認識型リレーショナル推論を統合した、複数文書・複数エンティティ問答をサポートするエンドツーエンドのエージェント型フレームワークです。
このフレームワークは、標準的なRAGおよびグラフベースRAGが抱える限界を、正確な事実の局在化、文書横断のエンティティ結合、エラーを認識した抽出を可能にすることで解決します。
3つのコアモジュールから構成されています：（1）最小限の結合可能スキーマを推定するスキーマ発見モジュール、（2）テキストをエラー補正を施してリレーショナル表に変換する抽出モジュール、（3）構造化表上でのマルチホップリレーショナル推論を行う推論モジュール。
二つのMDMEQAベンチマークの評価において、DocSageは最先端の長文コンテキストLLMsおよびRAGシステムを大幅に上回り、それぞれ27％を超える精度向上を達成しました。

マルチドキュメント・マルチエンティティ質問応答は、本質的に、散在する複数の文書間で複数のエンティティ間の暗黙的な推論を追跡することを要求します。しかし、現状の大規模言語モデル（LLMs）および検索強化生成（RAG）フレームワークには重大な制約があります：標準的なRAGのベクトル類似度に基づく粗い検索はしばしば重要な事実を見落とし、グラフベースのRAGは分断された複雑な関係ネットワークを効率的に統合できず、さらにスキーマ認識能力が欠如しているため、文書間の証拠連鎖の構築が不十分で、エンティティ間の関係推定が不正確になります。これらの課題に対処するため、動的スキーマ発見、構造化情報抽出、スキーマ認識型リレーショナル推論をエラー保証とともに統合したエンドツーエンドのエージェント型フレームワークであるDocSageを提案します。DocSageは3つのコアモジュールを介して動作します：（1）クエリ特有の最小限の結合可能スキーマを動的に推定して重要なエンティティと関係を捉えるスキーマ発見モジュール、（2）未構造化テキストを意味的に整合性のあるリレーショナル表へ変換する抽出モジュールで、誤検出を抑制するエラー認識補正メカニズムを強化したもの、（3）構造化された表の上でマルチホップのリレーショナル推論を行い、スキーマ認識を活用して文書横断のエンティティを効率的に整合させ、証拠を集約する推論モジュール。このエージェント型設計は、SQLを活用したインデクシングによる正確な事実の局在化、リレーショナル表を通じた文書横断のエンティティ結合を自然にサポート、構造化表現によるLLMのアテンション分散の緩和という3つの主要な利点を提供します。二つのMDMEQAベンチマークでの評価は、DocSageが最先端の長文コンテキストLLMsおよびRAGシステムを著しく上回り、それぞれ27％以上の精度向上を達成したことを示しています。

ブームの裏で制御AI未導入54％、工場の自動化阻むコストと人材不足

日経XTECH

光電融合の製造受託に野心、新光電気「TSMCにはない魅力を」

日経XTECH

中国AI企業が他社製AIを「ただ乗り蒸留」か米社が主張、安全保障リスクも

日経XTECH

高1数学で理解できる機械学習、回帰直線のグラフ表示へ

日経XTECH

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

日経XTECH

DocSage: 複数文書・複数エンティティ問答のための情報構造化エージェント

要点

関連記事

ブームの裏で制御AI未導入54％、工場の自動化阻むコストと人材不足

光電融合の製造受託に野心、新光電気「TSMCにはない魅力を」

中国AI企業が他社製AIを「ただ乗り蒸留」か米社が主張、安全保障リスクも

高1数学で理解できる機械学習、回帰直線のグラフ表示へ

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

ブームの裏で制御AI未導入54％、工場の自動化阻むコストと人材不足

光電融合の製造受託に野心、新光電気「TSMCにはない魅力を」

中国AI企業が他社製AIを「ただ乗り蒸留」か 米社が主張、安全保障リスクも

高1数学で理解できる機械学習、回帰直線のグラフ表示へ

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

中国AI企業が他社製AIを「ただ乗り蒸留」か米社が主張、安全保障リスクも