意図を考慮した検索と意味保持型チャンク化による効率的RAG

arXiv cs.CL / 2026/6/2

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、従来のRAGが抱える「意図に無関係な検索」と「情報の断片化」という課題に対処するRAGフレームワークInSemRAGを提案します。
  • InSemRAGは意図に応じて検索チャネルの重み付けを動的に調整する意図対応型リトリーバ(IAR)を用い、検索されたチャンクの関連性を高めます。
  • さらに、意味保持型チャンク化(SPC)により、損なわれたエビデンス・チャンクを検出して修復し、検索時の意味的整合性を維持することを目指します。
  • 証拠の選別を洗練するために反復的な「retrieve-and-check(検索と確認)」機構を採用し、反復による計算遅延を小言語モデル(SLM)で緩和します。
  • 複数のベンチマークで有力な性能が示され、HotPotQAでF1が+2.65、FEVERで精度が+1.5となり、SLM利用時にはMulti-Hop RAGに対して最大4.32倍の低レイテンシを達成します。

この記事の続きは原文サイトでお読みいただけます。

原文を読む →