AIエージェントをビジネス活用、知っておくべきRAGとマルチモーダルの基本

要点

RAG（検索拡張生成）は、Webや社内データなどの外部/独自情報を検索・取得し、LLMの生成に組み込むことでより正確な回答を可能にする仕組みだと説明しています。

　本特集では、書籍『AIエージェント設計＆実装完全ガイド』（日経BP）から抜粋した内容を基に、AIエージェントを実装および活用するための基礎知識を解説します。第5回では、「RAG」と「マルチモーダル」を取り上げます。

　今回は、大規模言語モデル（LLM）の応用的な機能であるRAG（Retrieval Augmented Generation：検索拡張生成）とマルチモーダルについて説明します。従来の生成AIは入力されたテキストに対して、事前に学習されたデータをもとにテキストで回答するものでした。ですがRAGによってWebや社内の情報を参照できるようになりました。

　さらにマルチモーダルによって、入力されたテキストに対して画像・動画を出力する、あるいは入力された画像や動画に対してテキストを出力することができるようになりました。いずれも生成AIのビジネス活用に大きく寄与した機能といえるでしょう。

書籍『AIエージェント設計＆実装完全ガイド』

ローコード開発やユースケースを徹底解説

「AIエージェント」の基礎・設計・実装を解説する技術書です。大規模言語モデルのAPIと、Difyを中心とした開発ツールを駆使して、AIエージェント開発の「いろは」を説明します。さらに「面接アシスト」「調査」「社内規定検索」「問い合わせ対応」の4種類のアプリを題材に、開発方法をわかりやすく解説します。

詳細・購入

外部の情報を組み合わせる

　RAGとは、「外部または独自の情報を組み合わせることで、より正確な回答を得られるフレームワーク」です。RAGは「Retrieve」「Augment」「Generate」で構成されます。

・Retrieve
　質問の回答に必要な情報を、Webや社内データベースなどから検索・取得します。

・Augment
　取得した情報と質問を組み合わせてLLM に入力するプロンプトを作成します。検索した情報をユーザープロンプトに反映させてプロンプトを再構築する点が特徴です。

・Generate
　Augmentで生成したプロンプトに対して、LLMが回答を生成します。

「RAG」の全体像

（出所：書籍『AIエージェント設計＆実装完全ガイド』）

[画像のクリックで拡大表示]

　具体的な流れを見てみましょう。ユーザーはまず、アプリケーションに質問を入力します（上図（1））。するとアプリケーションはデータベースなどを検索して（同（2））、回答に必要な情報を抽出・取得します（同（3））。

　次にアプリケーションはユーザーからの質問を抽出・取得した情報を使ってプロンプトをビルド（作成）します（同（4））。そしてLLMを呼び出してそのプロンプトを入力（同（5））。LLM が生成した回答をアプリケーションが受け取り（同（6））、ユーザーに回答として出力します（同（7））。

　RAGが注目される理由は、事前に学習したデータだけでは答えられなかった質問にも、外部情報を参照することで回答できるようになったからです。例えば、従来のLLMに社内の費用申請方法を聞いても、社内マニュアル等の情報は一般的に公開されていないため回答できませんでした。しかし、RAGによって社内マニュアルを参照させることで回答できるようになりました。

　また事前学習されたデータが古いと、必然的に回答の内容も古いといった問題もありました。ですがRAGならWeb上で最新情報を検索するため、その問題も解消できるようになりました。

　なお、LLMに外部または独自の情報を活用させる方法としては「ファインチューニング」という手法もあります。これは追加したい情報をLLMに直接学習させる手法です。ただ、大量のデータや高性能なGPUが必要になるため、ハードルが高いのが現状です。その点RAGは、LLMに追加学習させることなく外部情報を参照できるため、導入するハードルが低い点も注目されています。

AIエージェントをビジネス活用、知っておくべきRAGとマルチモーダルの基本

要点

書籍『AIエージェント設計＆実装完全ガイド』

外部の情報を組み合わせる

次のページ

関連記事

Black Hat USA

Black Hat Asia

日産社長「V6のHEVは内製」「N7には驚いた」、長期戦略で一問一答

ERPはAI活用の基盤に、SAPジャパンの堀川新社長

実はAIで大成功していたMeta、広告売上高がGoogle超えとの予測も

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

書籍『AIエージェント 設計＆実装 完全ガイド』

外部の情報を組み合わせる

次のページ

関連記事

Black Hat USA

Black Hat Asia

日産社長「V6のHEVは内製」「N7には驚いた」、長期戦略で一問一答

ERPはAI活用の基盤に、SAPジャパンの堀川新社長

実はAIで大成功していたMeta、広告売上高がGoogle超えとの予測も

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

書籍『AIエージェント設計＆実装完全ガイド』