要旨: 生成拡張型検索(RAG)は通常、クエリを静的で孤立したテキスト断片に直接対応付ける、平坦な検索パラダイムに依存しています。このアプローチは、異なる粒度にまたがって情報を条件付きで検索し、動的に統合する必要がある、より複雑なタスクではうまく機能しません(例:広い概念から具体的な根拠まで)。このギャップを埋めるために、受動的な断片検索から能動的な知識ナビゲーションへと転換する、新しい枠組み「NaviRAG」を提案します。NaviRAGはまず、知識ドキュメントを階層的な形に構造化し、粗い粒度のトピックから細かい詳細までの意味関係を保持します。この再編成された知識レコードを活用し、大規模言語モデル(LLM)エージェントがレコードを能動的にナビゲートし、情報の不足箇所を反復的に特定し、最も適切な粒度レベルから関連する内容を取得します。長文ドキュメントQAベンチマークに対する大規模な実験により、NaviRAGは従来のRAGベースラインに比べて、検索のリコールとエンドツーエンドの回答性能の両方を一貫して改善することが示されました。アブレーション研究により、性能向上は、本手法が多粒度の根拠ローカリゼーションと動的な検索計画を行える能力に起因することが確認されています。さらに、本手法の効率性、適用可能なシナリオ、今後の方向性について議論し、RAGシステムをより知的で自律的なものにすることを目指しています。
NaviRAG: 生成補強(Retrieval-Augmented Generation)における能動的な知識ナビゲーションに向けて
arXiv cs.CL / 2026/4/15
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 著者らは、RAGシステムをより知的で自律的にするための効率性に関する考慮事項、想定される応用シナリオ、今後の方向性についても議論している。




