生成AIが検索をどう破壊するか:Google Search、Gemini、AI Overviewsの実証研究

arXiv cs.CL / 2026/5/1

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisIndustry & Market MovesModels & Research

要点

  • 本研究は、Google Search、GoogleのAI Overviews(AIO)、Gemini Flash 2.5を11,500件の実ユーザー質問で比較し、生成AIがWeb検索をどう変えるかを検証している。
  • AIOは実ユーザーの51.5%のクエリで生成され、オーガニック検索結果の上部に表示されることが多く、特に論点の対立がある質問でAIOが出やすい。
  • 取得される情報源はシステムごとに大きく異なり(平均Jaccard類似度0.2未満)、従来のGoogleは政府や教育などの著名・機関サイトを優先する一方、生成型エンジンはGoogle所有コンテンツを選びやすい。
  • GoogleのAIクローラをブロックしているサイトは、コンテンツがアクセス可能でも、AIOにより取得される可能性が有意に低い。
  • AIOは同じクエリを2回実行したときの一貫性が低く、小さなクエリ修正に対しても頑健性が弱い。
  • これらの結果は、Webサイトの可視性、生成系のSEO(生成エンジン最適化)の有効性、ユーザーが受け取る情報に重大な影響を与えるため、出版社と生成検索提供者の双方にとって持続可能な収益モデルの整備を求めている。

Abstract

生成AIは、その利便性によってユーザに提供されることから、Web検索にますます統合されつつあります。本研究では、生成AIが、従来の検索エンジンとは異なる方法で情報と情報源を取得し提示することで、Web検索をどのように破壊(変容)するのかを理解することを目指します。本研究を支え、生成検索に関する今後の研究につなげるために、ユーザのクエリ11,500件からなる公開ベンチマークデータセットを導入します。各クエリについて、Googleの検索エンジンが返す検索結果、付随するAI Overview(AIO)、およびGemini Flash 2.5を比較します。いくつかの重要な知見が得られました。第一に、代表的な実ユーザクエリの51.5 ext{%}においてAIOが生成され、オーガニック検索結果の上に表示されることが分かります。論争的な問いはしばしばAIOを生み出します。第二に、取得される情報源が、検索エンジンごとに実質的に大きく異なることを示します(<0.2の平均Jaccard類似度)。従来のGoogle検索は、政府機関や教育機関の人気サイト、または機関系サイトから情報を取得する可能性が有意に高い一方で、生成検索エンジンは、Googleが保有するコンテンツを取得する可能性が有意に高いことがわかります。第三に、GoogleのAIクローラをブロックしているウェブサイトは、コンテンツにアクセスできるにもかかわらず、AIOによって取得される可能性が有意に低いことを観察します。最後に、AIOは同じクエリを2回実行した場合の処理において一貫性が低く、またクエリの些細な編集に対する頑健性も低いことが分かりました。本研究結果は、生成検索がウェブサイトの可視性に与える影響、生成エンジン最適化手法の有効性、そしてユーザが受け取る情報の内容を理解するうえで重要な示唆を持ちます。出版社と生成検索プロバイダのために、持続可能で相互に利益のあるエコシステムを促進する収益フレームワークを求めます。