AI Navigate

アンサー・バブル: AIを介した検索における情報露出

arXiv cs.CL / 2026/3/18

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 生成系検索システムは、引用における出典選択のバイアスを示し、通常のGPT、Search GPT、Google AI Overviews、従来のGoogle検索の間で特定の出典を他より優遇します。
  • 検索を組み込むことは、認識論的言語におけるヘッジ表現を最大60%低減させる一方、AI生成サマリーの自信表現は維持されます。
  • AI生成サマリーは引用バイアスをさらに増幅し、Wikipediaや長めの出典を不均衡に過大に取り上げる一方、引用されたソーシャルメディアのコンテンツや否定的に構成された出典を過少に表します。
  • 本研究は、同一のクエリがシステム間で異なる情報の現実像を生み出す『アンサー・バブル』の可能性を浮き彫りにし、ユーザーの信頼とAIを介した情報アクセスの透明性に影響を与えることを示唆します。

要旨: ジェネレーティブ検索システムは、リンクベースの取得をAI生成の要約へとますます置き換えており、これらのシステムが情報源、言語、引用材料への忠実度の点でどのように異なるかについては、まだ十分には分かっていない。私たちは、実際の検索クエリ11,000件に対する4つのシステム -- バニラGPT、Search GPT、Google AI Overviews、従来のGoogle検索 -- を、三つのレベルで検討する:情報源の多様性、生成された要約の言語的特徴づけ、情報源と要約の忠実度。ジェネレーティブ検索システムは、引用において顕著な \textit{source-selection} バイアスを示し、特定の情報源を他よりも優遇する。検索を組み込むことは、エピステミック・マーカーを選択的に弱め、AI生成要約における自信表現を維持しつつ、最大60%までの婉曲表現を減らす。同時に、AI要約は引用バイアスをさらに拡大する:Wikipedia や長い情報源が不均衡に過剰表示される一方、引用されたソーシャルメディアの内容や否定的に構成された情報源は大幅に過小表示される。我々の知見は、同一のクエリがシステム間で構造的に異なる情報現実をもたらす可能性のある「\textit{answer bubbles}」の潜在性を浮き彫りにしており、ユーザーの信頼、情報源の可視性、AIを介した情報アクセスの透明性に影響を与える。