チャンクのフィルタリングによるリトリーバル拡張生成(RAG)の冗長性削減
arXiv cs.CL / 2026/4/28
📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research
要点
- 通常のRAG(リトリーバル拡張生成)のチャンク分割では冗長なチャンクが多く生成され、保存コストの増加や検索(リトリーブ)の遅延につながりがちです。
- 本研究では、意味ベース、トピックベース、固有名詞(named-entity)ベースなどの軽量なチャンクフィルタリング手法により、検索品質を維持しつつインデックス化するコーパスを縮小することを検討します。
- 複数のコーパスで実験を行い、精度・再現率・交差(intersection)/統合(union)を用いたIoU(intersection-over-union)のトークンベース評価で検索性能を測定します。
- 結果として、固有名詞ベースのフィルタリングはベースラインに近い検索品質を保ちながら、ベクトルインデックスのサイズを約25%〜36%削減できることが示されます。
- これにより、チャンク分割が生み出す冗長性は効果的に抑えられ、RAGパイプラインのリトリーブ(検索)部分の効率が向上する可能性が示唆されます。




