検索拡張生成(RAG)を協調的な意思決定問題として捉え直す

arXiv cs.CL / 2026/4/27

💬 オピニオンModels & Research

要点

  • この論文は、多くの検索拡張生成(RAG)システムが、ジェネレータの品質が再ランカの出力に強く依存するという非対称な設計(ランキング中心の依存パイプライン)に基づいていると指摘しています。
  • そこで著者らは、再ランカとジェネレータを“対等な意思決定者”として捉え、共通の目的に向けて両者を共同最適化するCooperative RAG(CoRAG)を提案しています。
  • CoRAGは、文書の再ランキングと生成を連携させることで、最終回答の品質と一貫性(安定性)の向上を狙っています。
  • 実験により、CoRAGは一般化性能が良好で生成の安定性も向上し、約1万件のPopQAサンプルで学習した場合でも効果が示されたと報告されています。
  • 著者らは、他の研究者や開発者が再現・発展できるようにCoRAGモデルをGitHubで公開しています。

Abstract

検索拡張生成(Retrieval-Augmented Generation: RAG)は、外部の根拠に基づいて言語生成を行うことで、知識集約的なタスクにおいて強い有効性を示してきました。成功している一方で、既存の多くのRAGシステムはランキング中心の非対称な依存関係パラダイムに基づいて構築されており、生成器の生成品質が、再ランキング器の再ランキング結果に大きく依存しています。この制約を克服するために、本研究では、再ランキング器と生成器を非対称な依存パイプラインを介して接続されたものではなく、「対等な意思決定者(peer decision-makers)」として扱う枠組みであるCooperative Retrieval-Augmented Generation(CoRAG)を提案します。共通のタスク目的に向けてそれらの振る舞いを共同で最適化することで、再ランキング器と生成器は協調することが促され、文書の再ランキングと生成が連携して動き、最終的な応答の改善につながります。実験結果は、モデルが約10K件のPopQAサンプルのみで学習されている場合でも、CoRAGが良好な汎化性能を示し、生成の安定性が向上することを示しています。公開モデルは https://github.com/CoderrrSong/CoRAG です。