過熱報道を追いかけるな。ここ2、3年の学習でCRUDアプリケーションを作成してきたなら、基本的な構成要素はすでに手にしている。AIエージェントは魔法の力ではない――それはあなたがすでに書く方法を知っているコードの、賢いラッパーに過ぎない。
考えてみてください。あなたのVisual StudioやNetBeansのプロジェクトはすでに反応性のあるシステムを作り出しています。ユーザーがボタンをクリックすると、何らかの関数が呼び出されます。しかしAIエージェントはプロアクティブです。単に関数を呼ぶのではなく、設定されたゴールに基づいてどの関数を呼ぶべきかを決定します。
AIエージェントのアーキテクチャ
知覚 ➡️ 思考 ➡️ 行動 🧠
実務の世界では、AIエージェントの活動の流れは「ループ」と呼ばれます。これは基本的なソフトウェア工学であり、システム分析の単元と高度プログラミングの単元の評価基準に直接対応します。
ブレイン(LLM):
これはGPT-4やLlama 3に似た大規模言語モデル(LLM)です。これは何かを「知っている」わけではなく、単なる論理です。
ツール(あなたの関数):
これはあなたがプログラムする方法を学んだPython関数の集合です。Oracle SQLデータベースにアクセスする関数、天気を確認する関数、メールを送信する関数など。
ループ(エージェンティック・サイクル):
これはAIエージェントが目標を達成するまで実行する「while ループ」です。
学生レベルのユースケース: スマートライブラリアシスタント 📚
ここに基本的な「図書館管理システム」の簡単な例があります。
従来のCRUDプロセス:
ユーザーが検索ボックスに「Peaceful」という語を入力します。SQLコードは次のように実行されます: SELECT * FROM Books WHERE Title LIKE '%Peaceful%'. タイトルに「Peaceful」という語が含まれる本が1冊もない場合、検索結果は表示されません。
AIエージェント
ユーザーはAIエージェントにこう伝えます: 「大学で本当にストレスの多い日を過ごしました。リラックスできるものを見つけて。」
エージェンティック・プロセス - 知覚
AIエージェントはユーザーの入力を「見ます」。
思考
AIの「ブレイン」は、ユーザーがストレスを感じており、「リラクゼーション」に関連するトピックを提示する必要があると認識します。
行動
AIエージェントは、自分自身のキーワードセットを使ってsearch_database()関数を実行します。例えば「Meditation(瞑想)」、「Nature Photography(自然写真)」、「Fiction(小説)」など。
テックスタック: Lead Dev承認済み 🛠️
AIとデータサイエンスのユニットには高性能なハードウェアを使う必要はありません。私が使っているDell Vostroのような標準的なセットアップと、軽量なAPIで十分です。
Python:
これはAIの主な業界標準です。
Claude/OpenAPI:
これは「ブレイン」です。APIを使用すると、私のAMD統合グラフィックスのボトルネックを防ぐことができます。
LangChain:
これはアイデアを結びつけるのを助けるライブラリです。

