生成としてのリトリーバル:自己トリガー型情報計画を備えた統一フレームワーク

arXiv cs.CL / 2026/4/14

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、検索拡張生成(RAG)を、別個の外部コントローラや分類器を用いるのではなく、トークン単位のデコーディング過程に検索制御を直接統合することで再定義する。
  • 提案手法はGRIP(Generation-guided Retrieval with Information Planning)であり、単一の自己回帰的(autoregressive)な推論の軌跡の中で、モデルが制御トークンを発話して「いつ検索するか」「クエリをどのように言い換えるか」「いつ停止するか」を決定する。
  • 中核となる仕組みである自己トリガー型情報計画は、検索判断を推論と密に結び付け、推論の動的な複数ステップ化と、その場での証拠統合を支援する。
  • 著者らは、答え可能・部分的に答え可能・マルチホップのクエリタイプにまたがる構造化された教師信号を導入し、それぞれの学習用の検索行動に対して特定のトークンパターンを対応付ける。
  • 5つのQAベンチマークにおける実験では、GRIPが強力なRAGベースラインを上回り、かつパラメータ数を大幅に少なくしながらGPT-4oと競争力のある性能を示す。