広告

SRAG:構造化データ付きRAGはベクトル検索を改善する

arXiv cs.CL / 2026/3/31

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、標準的なRAGが埋め込み(embedding)に基づく表現の類似度に大きく依存しており、クエリとチャンクがベクトル類似度だけでは不十分で、より精密な根拠付け(grounding)を必要とする場合に性能が低下し得ると主張する。
  • クエリと取得したチャンクの両方に、トピック、センチメント、クエリ/チャンクのタイプ、知識グラフのトリプル、セマンティックタグといった構造化シグナルを付加する「Structured RAG(SRAG)」を提案する。
  • 実験の結果、SRAGは検索プロセスを大幅に改善し、ユーザーの意図と取得される情報の間の整合性がより良くなることが示される。
  • 質問応答設定において、LLM-as-a-judgeとしてGPT-5を用いると、SRAGは回答のスコアリングを約30%改善する(p値 = 2e-13)。特に、比較(comparative)、分析(analytical)、予測(predictive)タイプの質問で改善が大きい。
  • 著者らは、SRAGがより広範で多様な、かつエピソード(episodic)風の検索を支援すると同時に、テールリスクの結果も改善する(相対的に小さな損失で大きなゲインがより頻繁に生じる)。

Abstract

Retrieval Augmented Generation(RAG)は、ベクトルデータベースから取得したチャンク、またはWeb検索によって得られる情報の断片という形で、LLMに必要な情報的根拠を提供します。RAGは、事実情報をLLMに与える手段として、知識グラフのトリプルを用いることもできます。しかし、取得は質問と内容の間の表象的な類似性のみに基づいています。RAGの性能は、クエリとチャンクの数値ベクトル表現に依存します。これらの表現を改善するために、Structured RAG(SRAG)を提案します。SRAGは、トピック、センチメント、クエリおよびチャンクの種類(例:情報的、量的)、知識グラフのトリプル、セマンティックタグといった形式で、チャンクに加えてクエリにも構造化された情報を付与します。実験の結果、この手法は取得プロセスを大幅に改善することが示されています。LLM-as-a-judgeとしてGPT-5を用いたところ、質問応答システムにおける回答に付与されるスコアが30%改善することが分かりました(p値 = 2e-13)(より厳密な範囲を伴う)。最大の改善は、比較、分析、予測に関する質問で見られます。これらの結果は、提案手法がより広範で、多様で、エピソード形式の取得を可能にすることを示唆しています。テールリスク分析では、SRAGは損失の大きさが軽微にとどまりつつ、非常に大きな改善を得ることがより頻繁に起こることが示されます。

広告