リトリーバルの再構築:企業のRAG導入がスケールの壁に当たる中で、ハイブリッド・リトリーバルの意図が3倍になった理由

VentureBeat / 2026/4/30

💬 オピニオンSignals & Early TrendsIndustry & Market MovesModels & Research

要点

  • 2026年Q1は、企業のRAGが新しいリトリーバル層を追加する段階から、すでに導入済みのリトリーバルスタックを修正・最適化する段階へ移ったとされ、記事ではこれを「retrieval rebuild」と呼んでいます。
  • ハイブリッド・リトリーバルの導入意向は1四半期で10.3%から33.3%へ急増しましたが、一方で22%の回答者は本番のRAGシステムが存在しないと報告しています。
  • ハイブリッド・リトリーバルは、密な埋め込みに加えて疎なキーワード検索と再ランキングを組み合わせ、エージェント型の本番ワークロードに必要な検索精度とアクセス制御を高めるため、企業の主流戦略になりつつあります。
  • 単体のベクトルDBの採用は四半期を通じて減少(例:Weaviate、Milvus、Pinecone、Qdrant)し、その代替としてカスタム構成や提供事業者ネイティブのリトリーバルがシェアを受けています。
  • 2025年にRAGを急拡大させた企業は、エージェント規模で同じ失敗ポイントに直面し始めており、評価・関連性テストからリトリーバル最適化へと予算の重点が移っています(19.0%→3月28.9%)。

2026年Q1に、エンタープライズRAGで何かが変わりました。1月から3月までのVB Pulseデータは、揺るぎない一貫した物語を示しています。市場は新たにリトリーバル層を追加するのをやめ、すでに持っているものを修正し始めたのです。これを「リトリーバルの再構築」と呼びましょう。

調査は、従業員100人以上の組織を対象に、月次の3つの連続した波で実施されました。プラットフォーム導入、購買意向、アーキテクチャ見通し、評価基準において、月ごとに45〜58の適格回答者がいました。データは方向性を示すものとして扱うべきです。

ハイブリッド・リトリーバルを採用するエンタープライズの意向は、わずか1四半期で10.3%から33.3%へ3倍になりました。にもかかわらず、適格なエンタープライズ回答者の22%は、そもそも本番環境のRAGシステムを持っていないと報告しています。エージェント型AIのインフラを構築するデータエンジニアやエンタープライズアーキテクトにとって、このデータは、市場が積極的に移行中であることを明らかにします。スケールさせるために多くの企業が作り上げたRAGアーキテクチャは、年末までに実行するつもりのものとは一致していないのです。 

ハイブリッド・リトリーバルは、エンタープライズのコンセンサス戦略になりました。ベクトル類似度だけに依存する単一手法のRAGパイプラインとは異なり、ハイブリッド・リトリーバルは、疎なキーワード検索とリランキング層を、密な埋め込みと組み合わせます。単純さを引き換えに、プロダクションのエージェント型ワークロードに必要なリトリーバル精度とアクセス制御を得るのです。

スタンドアロンのベクトルDBカテゴリは、圧力を受けています。Weaviate、Milvus、Pinecone、Qdrantはいずれも、VB Pulseデータ上で四半期を通じて導入シェアを失いました。カスタムスタックや、プロバイダーネイティブのリトリーバルが、その置き換え分を吸収しています。

増えつつある少数派のエンタープライズは、そもそもRAGから後ずさりしています。これは、市場の成熟が進んでいるという物語に、意味のある例外があることを示すシグナルです。

2025年にRAGを広く展開した組織が、同じ失敗ポイントにぶつかっています。文書のリトリーバルのために作られたアーキテクチャは、エージェント型スケールでは持ちません。

急速にRAGをスケールさせたエンタープライズは、いまそれを作り直すコストを払っている

Q1における最大の2つの意向の変化は、直接つながっています。すなわち、スケールした状況でリトリーバルの品質問題に直面したエンタープライズと、コンセンサスの答えとしてハイブリッド・リトリーバルが台頭していることです。

投資の優先順位も並行して変わりました。評価と関連性のテストは、1月には予算意向を32.8%で牽引していましたが、3月には15.6%まで低下しました。リトリーバル最適化は逆方向に動き、19.0%から28.9%へ上昇しました。評価を初めて上回り、最も伸びる投資領域になったのです。 

HyperFRAME Researchの副社長兼プラクティスリードであるSteven Dickensは、3月のVentureBeatのインタビューで、エンタープライズのデータチームが「ベンチャー企業向けの重荷」とも言えるほどの負担を負っていることをOracleのエージェント型AIデータスタックを題材に説明しました。 Dickensは次のように述べています。「データチームは分断による疲労に疲れ切っています。エージェントを1つ動かすだけのために、別々のベクトルストア、グラフデータベース、リレーショナルシステムを管理するのは、DevOpsの悪夢です。」

その疲労は、プラットフォームデータにそのまま表れています。カスタムスタックの増加が35.6%に達したのは、マネージドのリトリーバルを否定する動きではありません。多くの組織は両方を運用しています。これは、あまりにも多くのコンポーネントを寄せ集めて組み立てることの限界にぶつかったエンジニアリングチームによる、統合のための反応です。

すべてのエンタープライズがそこまで到達したわけではありません。VB Pulseデータには、市場全体の成長シナリオを複雑にするシグナルが含まれています。3月時点で、適格回答者の22.2%が本番環境のRAGを持っていないと報告しており、1月の8.6%から増えています。報告書では、この層を「まだいかなるリトリーバル・インフラにもコミットしていない、またはプログラムを一時停止している」組織だとしています。これらは、ヘルスケア、教育、政府に集中しており、同じセクターが最も高いフラットな予算率を示しているのと一致します。

単体のベクトルデータベースは導入の主張を失いつつあるが、信頼性の議論では勝っている

VentureBeatによる最近の報道が、専用のリトリーバル層がなぜ本番環境で依然として重要なのかを示しています。 

Qdrant上で構築する2つのエンタープライズが、本番環境ではなぜ目的に特化したベクトル基盤が勝つのかを説明します。

 &AIは特許侵害訴訟のためのインフラを構築しており、数億件規模の文書に対してセマンティック検索を実行しています。すべての結果を実在する一次資料の文書に基づけることは、オプションではありません。特許弁護士は、AIが生成した文章に基づいて行動しません。その要件が、アーキテクチャ上の選択を明確にします。

「エージェントがインターフェースだ」と、&AIの創業者兼CTOのHerbie Turnerは3月にVentureBeatへ語りました。「ベクトルデータベースが唯一の真実(ground truth)です。」

シーメンスやマーレがスタートアップを評価できるよう支援するスタートアップであるGlassDollarは、インデックスされた文書が約1,000万件に近づくコーパスに対して、エージェント型のリトリーバル手法を実行しています。単一のユーザープロンプトが複数の並列クエリに分岐し、それぞれが別の角度から候補を取得したうえで、結果が結合され再ランキングされます。このクエリ量と精度要件が、目的に特化したベクトル基盤を選ぶ原動力になりました。

「成功を測るのはリコールです」と、GlassDollarのプロダクト責任者であるKamen Kanevは3月にVentureBeatへ語りました。「最良の企業が結果に含まれないなら、ほかのことは何も意味がありません。ユーザーは信頼を失います。」

VB Pulseデータは、こうした見方――リトリーバルを「特徴」ではなく「唯一の真実」として捉えること――が、スタンドアロンのベクトルデータベースの導入が減少しているにもかかわらず、より広いエンタープライズ市場で勢いを増していることを示しています。 

エンタープライズが専用のベクトル層を必要としている理由が、Q1を通じて大きく変化したのはなぜでしょうか。1月の上位理由は、アクセス制御の複雑さ(20.7%)とリトリーバル精度(19.0%)でした。3月には、スケール時の運用上の信頼性が31.1%へと急増し、すべてを上回り2倍以上になりました。企業は、ベクトル基盤を主に精度のために保持しているわけではありません。問い合わせ量が増えてスケールしたときに、信頼できるスタックの一部だからこそ保持しているのです。

エンタープライズは「良いリトリーバル」の定義をどう変えているか

エンタープライズがリトリーバルシステムをどのように評価するかは、Q1を通じて大きく変化しました。そして、その変化の方向性は、「良いリトリーバル」が実際に何を意味するのかについて、市場がより洗練されつつあることを示しています。

1月は、応答の正確さが評価基準で67.2%を占めており、他の何よりも大きく突出していました。ところが3月には、応答の正確さ(53.3%)、リトリーバルの精度(53.3%)、回答の関連性(53.3%)が完全に収束しました。正しい答えを得ることだけでは不十分になったのです。たとえ正しくても、それが誤った文書から来ていたり、質問の文脈を取り逃していたりすれば、価値はありません。

回答の関連性は、四半期を通じて唯一上昇した基準で、5ポイント増えました。また、測るのが最も難しい基準でもあります。取得された文脈が、その特定の質問に対して実際に正しい文脈かどうかは、単なる合否判定のチェックだけでは足りず、目的に特化した評価基盤が必要です。その上昇は、基本的なRAGテストを完全に通り過ぎたエンタープライズ買い手が、一定の割合で存在することを示しています。 

市場の判定:RAGは死んでいない。元のアーキテクチャが

「RAGは死んだ」という物語には、2026年に向けて実際の勢いがありました。そこには2つの主張がありました。第一に、長いコンテキストウィンドウ――単一のプロンプトで数十万トークンを処理できるモデル――によって、専用のリトリーバルは不要になるということ。第二に、エージェント型メモリシステム――エージェントがセッション間で学習内容を保持し、毎回それを新たに取り直すのではなく、その知識アクセス問題が完全に吸収されるということです。

VB Pulseデータは、エンタープライズ市場による最初の主張への回答です。長いコンテキストが支配するアーキテクチャを支持する立場は、1月の15.5%から2月には3.5%へ崩れ、その後3月には一部回復して6.7%になりました。1月のサンプルは、テクノロジーおよびソフトウェアの回答者に大きく偏っていました。これは、2025年後半の時点で長いコンテキストのモデル発表に最もさらされているセグメントです。サンプルの多様化が進むにつれて、その立場は消えていきました。

メモリに関する問いについて、DatabricksのチーフAIサイエンティストであるJonathan Frankleは、VentureBeatとの3月のインタビューで、エージェント型メモリのアーキテクチャを明確に整理しました。エージェント型メモリスタックの基盤には、何百万件ものエントリを持つベクターデータベースがあり、コンテキストに収まるには大きすぎます。LLMのコンテキストウィンドウはその最上部に位置します。これらの間では、新しいキャッシングや圧縮の層が登場しつつありますが、それらはいずれも基盤にあるリトリーバル(検索)層を置き換えません。Vectorizeが開発したHindsightのような新しいエージェント型メモリシステムや、Mastraフレームワークにおける観測的メモリのアプローチは、時間をまたいだセッション継続性やエージェントの文脈(コンテキスト)を扱います。これは、変化し続ける何百万もの企業ドキュメントに対する高い再現性の検索という課題とは別の問題です。

最も重要なシグナルは、年末までに大規模なRAG導入を期待していない回答者の割合が、3.4%から15.6%へと増えたことです。これは約5倍です。これはリトリーバルに対する断罪ではありません。まず多くの企業が最初に作ったリトリーバルのアーキテクチャに対する断罪です。

リトリーバルの作り直しは任意ではない

リトリーバルの作り直しは、「実際にそれを支えられるアーキテクチャ」を最初に決めずにRAGをスケールさせるためのコストです。

あなたの組織が、RAGをより多くのワークフローへ拡大する計画をQ1に立てた43.1%の中に入っているなら、VB Pulseのデータが示すところでは、その計画はすでに多くの同業他社で変わっており、あなたの組織でも変える必要があるかもしれません。ハイブリッド・リトリーバルが最終到達点というのがコンセンサスです。35.6%までのカスタムスタックの拡大は、市販の製品だけでは十分に満たせない要件の周りにリトリーバル基盤を作り込んでいるチームが増えていることを反映しています。

RAGは死んでいません。RAGを実装するために多くの企業が使ってきたアーキテクチャが死んでいます。データは、その作り直しが未来の判断ではないことを示唆しています。33%の企業にとって、この作り直しはすでに公言された優先事項です。