SRAG:構造化データ付きRAGはベクトル検索を改善する
arXiv cs.CL / 2026/3/31
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、標準的なRAGが埋め込み(embedding)に基づく表現の類似度に大きく依存しており、クエリとチャンクがベクトル類似度だけでは不十分で、より精密な根拠付け(grounding)を必要とする場合に性能が低下し得ると主張する。
- クエリと取得したチャンクの両方に、トピック、センチメント、クエリ/チャンクのタイプ、知識グラフのトリプル、セマンティックタグといった構造化シグナルを付加する「Structured RAG(SRAG)」を提案する。
- 実験の結果、SRAGは検索プロセスを大幅に改善し、ユーザーの意図と取得される情報の間の整合性がより良くなることが示される。
- 質問応答設定において、LLM-as-a-judgeとしてGPT-5を用いると、SRAGは回答のスコアリングを約30%改善する(p値 = 2e-13)。特に、比較(comparative)、分析(analytical)、予測(predictive)タイプの質問で改善が大きい。
- 著者らは、SRAGがより広範で多様な、かつエピソード(episodic)風の検索を支援すると同時に、テールリスクの結果も改善する(相対的に小さな損失で大きなゲインがより頻繁に生じる)。



