あなたのRAGシステムは、完璧なスコアで正しいドキュメントを取得しています——それでも自信満々に間違った答えを返してしまいます。
私は220MBのローカル実験を構築し、ほとんど誰も話題にしない隠れた失敗モードを実証しました。同じ取得ウィンドウ内で文脈が衝突しているのです。矛盾する2つのドキュメントが返ってきて、モデルはそのうちの1つを選びます。その結果、警告ゼロで、流暢だけれど誤った応答が得られます。
この記事では、なぜそれが起きるのかを正確に示し、サイレントに壊れる3つの本番シナリオと、それを直す小さなパイプライン層を紹介します——追加のモデルも、GPUも、APIキーも不要です。
システムは、まさに設計どおりに動作しました。それでも答えは間違っていました。
この記事はTowards Data Science にて最初に Your RAG System Retrieves the Right Data — But Still Produces Wrong Answers. Here’s Why (and How to Fix It). として掲載されました。



