関連性から権威へ：Web検索エンジンにおける権威を考慮した生成的リトリーバル

arXiv cs.CL / 2026/4/16

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、Web検索における生成的情報検索（GenIR）は、特に医療や金融のようなハイステークス領域では、関連性だけでなく文書の信頼性（trustworthiness）も最適化すべきだと主張している。
「Authority-aware Generative Retriever（AuthGR）」を提案する。これは、マルチモーダルな権威スコアリングにビジョン・ランゲージモデルを用い、GenIRに明示的に「権威」を組み込む初の枠組みである。
AuthGRは3段階のトレーニング・パイプラインを用い、段階的にリトリーバに対して権威認識を学習させ、その後、ハイブリッドなアンサンブルによるデプロイ方法を採用する。
オフライン実験では、権威および検索精度の向上が示されており、3Bモデルが14Bベースラインと同等の性能を達成した。
大規模なオンラインA/Bテストと商用Web検索プラットフォームでの人手評価により、実際のユーザーエンゲージメントおよび信頼性の認知において有意な改善が確認された。

概要: 生成的情報検索（GenIR）は、検索プロセスをテキストからテキストへの生成タスクとして定式化し、大規模言語モデルが持つ膨大な知識を活用します。しかし、既存の研究は主として関連性の最適化に取り組む一方で、文書の信頼性（trustworthiness）を見落としがちです。これは、医療や金融のような高リスク領域において、意味的な関連性だけに頼ると信頼できない情報を取得してしまうおそれがあるため、極めて重要です。そこで本研究では、権威（authority）をGenIRに組み込む初の枠組みである、Authority-aware Generative Retriever（AuthGR）を提案します。AuthGRは3つの主要コンポーネントから構成されます。（i）マルチモーダルな権威スコアリング：視覚言語モデルを用いて、テキストおよび視覚的手がかりから権威を定量化します。（ii）3段階の学習パイプライン：検索器へ段階的に権威への注意（authority awareness）を浸透させます。（iii）頑健な実運用のためのハイブリッドアンサンブル・パイプラインです。オフライン評価により、AuthGRが権威と精度の両方を確実に向上させることが示されます。具体的には、3Bモデルが14Bベースラインに一致します。さらに重要なのは、商用Web検索プラットフォーム上で実施した大規模なオンラインA/Bテストと人手評価によって、現実のユーザーのエンゲージメントと信頼性が有意に改善したことが確認された点です。