「類似ではない」:多ホップ検索のためのコーパス固有の関連性を学習する
arXiv cs.CL / 2026/4/24
💬 オピニオンDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- 本論文は、埋め込みの類似度だけに頼らず、コーパスに固有な「関連性」を学習して候補を再ランキングする Association-Augmented Retrieval(AAR)を提案している。
- AARは、共起アノテーションに基づくコントラスト学習で学習した4.2Mパラメータ規模のMLPを用い、推論時にパッセージ間の双方向の関連スコアリングで並べ替える。
- HotpotQAではAARが passage Recall@5 を0.831から0.916へ(+8.6ポイント)向上し、評価セットのチューニングなしで効果が出ており、特にdenseベースラインが失敗する難問で最大+28.5ポイントの伸びが見られる。
- MuSiQueでも転導(transductive)設定で+10.1ポイントの改善が得られ、さらに誘導(inductive)では有意な向上が見られないことから、学習した関連性は移植可能というよりコーパス固有の共起を捉えていることが示唆される。
- 手法は軽量で現実的であり、クエリあたり約3.7msの追加、単一GPUで2分未満の学習、LLMベースのインデキシング不要であるうえ、検索改善が下流QAでexact matchを+6.4改善することも示されている。



