IndexRAG: インデックス時点でのクロスドキュメント推論のための事実を橋渡しする

arXiv cs.CL / 2026/3/18

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • IndexRAG は、ドキュメント間の橋渡しエンティティを特定し、独立して検索可能なユニットとして橋渡し事実を生成することで、クロスドキュメント推論をオンライン推論からオフラインインデックス作成へと移行する。
  • このアプローチは追加のトレーニングやファインチューニングを必要とせず、推論時に1回のLLM呼び出しで単一パスの検索を可能にする。
  • HotpotQA、2WikiMultiHopQA、MuSiQueの実験で、Naive RAGと比較して平均F1が4.6ポイント向上した。
  • IRCoTと組み合わせると、IndexRAGはHippoRAGやFastGraphRAGといったグラフベースのベースラインを上回り、フラットリトリーバルに依存する一方で、コードは採択時に公開される予定。

要旨:マルチホップ質問応答(QA)は複数の文書にまたがる推論を必要としますが、既存の検索強化生成(RAG)アプローチは追加のオンライン処理を要するグラフベース手法または反復的な多段推論のいずれかで対処します。私たちはオンライン推論をオフラインのインデックス作成へ移す新しいアプローチ、IndexRAGを提示します。IndexRAGは文書間で共有される橋渡しとなるエンティティを特定し、独立して取得可能なユニットとして橋渡しとなる事実を生成します。追加の訓練や微調整を必要としません。三つの広く用いられているマルチホップQAベンチマーク(HotpotQA、2WikiMultiHopQA、MuSiQue)での実験は、IndexRAGがNaive RAGに対してF1値を平均で4.6ポイント改善することを示しますが、推論時には単回取得と1回のLLM呼び出しのみを必要とします。IRCoTと組み合わせた場合、IndexRAGはHippoRAGとFastGraphRAGを含むすべてのグラフベースのベースラインを平均で上回り、フラット取得のみを利用します。我々のコードは採択され次第公開します。