Graphs RAG at Scale:ラベル付きプロパティグラフおよびリソース記述フレームワークによる複雑かつ未知の探索空間を越えて――検索拡張生成を超える

arXiv cs.AI / 2026/3/25

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ラベル付きプロパティグラフ(Labeled Property Graph:LPG)とリソース記述フレームワーク(Resource Description Framework:RDF)を組み合わせた、エンドツーエンドのGraph RAGフレームワークを提案し、探索空間が未知である場合や、ドキュメントが半構造化/構造化されている場合に、検索(retrieval)を改善する。
  • JSONのキー・バリュー対からRDFトリプルへ文書を変換する手法を導入し、大規模な前処理を行わずにGraph RAGが半構造化データを取り込めるようにする。
  • 著者らは、LPG向けのテキストtoシファー(text-to-Cypher)フレームワークを提示しており、自然言語の問い合わせをCypherへ変換することで、リアルタイム精度90%以上を実現し、迅速なオンラインでのクエリ生成を可能にする。
  • 評価では、Graph RAGが埋め込みベースのRAGよりも、精度、応答品質、複雑なタスクにおける推論において優れていると主張し、検索件数を事前に厳密に指定する必要性を減らし、非効率な再ランキングに依存しないことを示している。

Abstract

Recent advances in Retrieval-Augmented Generation (RAG) have revolutionized knowledge-intensive tasks, yet traditional RAG methods struggle when the search space is unknown or when documents are semi-structured or structured. We introduce a novel end-to-end Graph RAG framework that leverages both Labeled Property Graph (LPG) and Resource Description Framework (RDF) architectures to overcome these limitations. Our approach enables dynamic document retrieval without the need to pre-specify the number of documents and eliminates inefficient reranking. We propose an innovative method for converting documents into RDF triplets using JSON key-value pairs, facilitating seamless integration of semi-structured data. Additionally, we present a text to Cypher framework for LPG, achieving over 90% accuracy in real-time translation of text queries to Cypher, enabling fast and reliable query generation suitable for online applications. Our empirical evaluation demonstrates that Graph RAG significantly outperforms traditional embedding-based RAG in accuracy, response quality, and reasoning, especially for complex, semi-structured tasks. These findings establish Graph RAG as a transformative solution for next-generation retrieval-augmented systems.