取得(Retrieval)は、ほとんどのRAGシステムが静かに破綻する箇所です。従来のパイプラインは、ベクトル類似度に依存します――クエリとドキュメントのチャンクを同じ空間に埋め込み、「最も近い」一致を取得するのです。しかし類似度は、私たちが本当に必要としているものに対する弱い代理指標です。つまり、推論に根ざした関連性です。長く専門的な文書――たとえば財務レポート、研究論文、または法的テキスト――では、正しい答え[…]
この投稿 RAG Without Vectors: How PageIndex Retrieves by Reasoning は、最初に MarkTechPost に掲載されました。




