HaS:相同性(ホモロジー)を考慮した推論型リトリーバルでRAGを高速化
arXiv cs.CL / 2026/4/23
💬 オピニオンDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- 本論文は、RAG(Retrieval-Augmented Generation)の高速化を目的に、「相同性(ホモロジー)を考慮した推論型リトリーバル(speculative retrieval)」であるHaSを提案しています。
- HaSは、遅いフルデータベース検索を避けるため、まず限定された範囲で低遅延の推論型リトリーバルにより候補文書を取得し、その後に相同性に基づいて候補を検証します。
- 検証は「相同クエリ再同定」タスクとして定式化され、過去に観測された相同なクエリが新規クエリと同等であると確認できれば、ドラフトを許容して高コストな検索をスキップできます。
- 実験では、HaSが取得(リトリーバル)のレイテンシを23.74%および36.99%削減しつつ、精度の低下は1〜2%にとどまることが示され、さらにマルチホップのエージェント型RAGでもプラグアンドプレイで高速化できると報告されています。
- 著者はGitHub上でソースコードを公開しており、導入や追加検証を支援しています。




