RAG(検索拡張生成)の心臓は、埋め込み(embedding)とベクトル検索です。文章を「意味を表す数のならび(ベクトル)」に変換し、質問のベクトルに近いものを高速に探し出す——この2段で「自社データに基づいて答えるAI」が成り立ちます。本稿は開発者向けに、仕組み・実装の勘所・2026年時点の選択肢を、図とともに具体的に整理します。
FIG.1 文章 →(埋め込みモデル)→ ベクトル → 近いベクトルを探す、という2段構え
01埋め込みとは「意味を座標にする」こと
埋め込みモデルは、入力テキストを固定長の数値ベクトル(例: 1536次元)に変換します。学習の結果、意味が近い文ほど近い場所に配置されるのが核心です。たとえば「経費精算のやり方」と「立替金の申請手順」は語が違っても近くに置かれ、「来期の売上目標」は遠くに置かれます。
キーワード検索が「文字の一致」で探すのに対し、ベクトル検索は「意味の近さ」で探す——この違いが、表記ゆれや言い換えに強い理由です。「近さ」の物差しには、ベクトルの向きの一致度を見るコサイン類似度がよく使われます(多くの埋め込みモデルが正規化済みベクトルを返すため、内積でも実質同じになります)。