SEARCH-R:連鎖的推論ナビゲータによるマルチホップ質問応答のための構造化されたエンティティ認識型リトリーバル

arXiv cs.CL / 2026/4/28

📰 ニュースModels & Research

要点

  • 本論文は、マルチホップ質問応答における代表的な失敗要因である「推論経路の制御不足」と「有用性の低い検索」を改善するためのフレームワークSEARCH-Rを提案する。
  • SEARCH-Rは、Llama 3.1 8Bを微調整してサブ質問の分解を強化することで、推論の連鎖(chain-of-reasoning)をエンドツーエンドで導くナビゲータを学習する。
  • さらに、類似度やマッチングに主に依存するのではなく、依存関係ツリーに基づいて文書の情報的寄与を定量評価する新しい検索手法を設計する。
  • 難易度の高い3つのマルチホップデータセットでの実験により、従来のプロンプトベース手法や検索の組み合わせ手法に対して有効性が検証される。
  • 著者は、検証やさらなる研究に向けて、リンクされたGitHubリポジトリでコードとデータセットを公開している。

Abstract

多段(マルチホップ)質問応答(MHQA)は、多段の推論を必要とする質問に答えることを目指します。これには2つの重要な課題があります。すなわち、複雑なユーザーの問い合わせに応答して正しい推論経路を生成すること、そして、大規模言語モデル(LLMs)における潜在的な制約の可能性を踏まえつつ、重要な知識を正確に取得することです。既存の手法は主に、プロンプトベースの方法で推論経路を生成し、それを伝統的な疎または密な検索と組み合わせて最終回答を作ることに依存しています。しかし、推論経路の生成では、生成プロセスを効果的に制御できないことが多く、その結果として推論がそれてしまいます。一方で、検索手法は情報の実用性を評価するのではなく、知識の一致や類似度スコアに過度に依存しているため、同質的または有用でない情報を取得してしまいます。そこで本研究では、SEARCH-R と名付けた「チェーン・オブ・レソニング・ナビゲータ」を備えた構造化エンティティ認識型検索フレームワークを提案します。具体的には、SEARCH-R は Llama3.1-8B モデルを微調整することで強力なサブ質問分解器を提供できる、エンドツーエンドの推論経路ナビゲータを学習します。さらに、文書の情報的寄与を定量的に評価するための、新規な依存構造ツリーに基づく検索が設計されています。3つの困難なマルチホップデータセットに対する大規模な実験により、提案フレームワークの有効性が検証されています。コードとデータセットは以下で利用可能です:https://github.com/Applied-Machine-Learning-Lab/ACL2026_SEARCH-R。