SPIRE:構造を保持した解釈可能な証拠のリトリーバル(Structure-Preserving Interpretable Retrieval of Evidence)
arXiv cs.CL / 2026/4/24
💬 オピニオンDeveloper Stack & InfrastructureModels & Research
要点
- この論文は、HTMLのような半構造化ドキュメントに対するRAG(retrieval-augmented generation)が、文書構造がフラットなチャンクに平坦化されてしまうことにより制約を受けると指摘しています。
- SPIREは、木構造の文書に対して動作し、検索候補をパスやパス集合などの構造プリミティブで定義されたアドレス可能なサブドキュメント(部分選択)として表現する、構造を保持したリトリーバル手法を提案します。
- SPIREはグローバルおよびローカルの文脈化を導入しており、グローバルはタイトルや見出し、リスト/テーブル構造などの非局所的な足場を追加し、ローカルは近傍の構造内でシード選択を拡張して、予算内のコンパクトで文脈に富む証拠を作ります。
- 埋め込みベースの候補生成(文中文としてのシード付きサブドキュメントの索引化)と、共有する構造文脈を使い回すクエリ時の集約ステップを備え、その後にローカル文脈化ビューで再スコアするコンテキストフィルタリングを行います。
- HTMLの質問応答ベンチマークでの実験では、固定された検索予算のもとで、SPIREが強力なパッセージベースのベースラインより高品質かつ多様な引用を実現しつつ、スケーラビリティも維持できることが示されています。


