キャッシュとしてのIE:情報抽出によるエージェント的推論の強化

arXiv cs.CL / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文は、情報抽出(IE)が最終出力として扱われることが多く、多段推論の途中で再利用されない点を指摘しています。
  • 「IE-as-Cache」は、IEを認知キャッシュとして再利用し、推論の複数ステップでエージェント的推論を支える枠組みを提案しています。
  • 提案手法では、クエリ駆動の抽出とキャッシュを意識した推論を組み合わせ、コンパクトな中間情報を保持しつつノイズを抑えることを目指します。
  • 複数のLLMと難易度の高いベンチマークでの実験により、推論精度の向上が示され、IEが再利用可能な認知リソースになり得ることが示唆されています。
  • 著者らは、IEの下流用途をスタンドアロンの抽出にとどめず活用するための有望な研究方向として、この考えを位置付けています。

Abstract

情報抽出(Information Extraction)は、非構造化テキストから意思決定に資する構造化された情報を抽出し、下流の理解や推論の基盤として機能することを目的とします。しかし従来、それは単なる終端目標として扱われることが一般的でした。すなわち、抽出が完了すると得られた構造はしばしば単独で消費され、多段階の推論の間に維持され再利用されることはあまりありませんでした。そこで本研究では、この考え方を超えて、IEを認知キャッシュとして再利用する枠組みである\textit{IE-as-Cache}を提案します。階層的なコンピュータメモリから着想を得た本アプローチでは、クエリ駆動型の抽出と、キャッシュを意識した推論を組み合わせることで、コンパクトな中間情報を動的に維持し、ノイズを効果的にフィルタします。多様なLLMにわたる困難なベンチマークでの実験により、推論精度が大幅に向上することが示されました。これは、IEが再利用可能な認知リソースとして有効に再活用でき、さらに下流用途におけるIEの将来の研究に向けた有望な方向性を示すものです。