Cloudflareはそれをあなたのために一括で記憶できます
エージェントメモリはAIチャットの断片を脇に保存し、必要なときに呼び出します
ハードウェアのメモリが不足しがちなだけでなく、コンテキストメモリ――AIモデルとやり取りされる会話データ――も問題になり得ます。
この特定の課題に対するCloudflareの答えが「エージェントメモリ」です。スペースが限られているときにAIの会話を退避(サイフォン)し、必要に応じてデータを注入(戻し込み)するマネージドサービスです。
「エージェントAIに永続的なメモリを与え、重要なものを思い出し、不要なものは忘れ、時間とともに賢くなることを可能にします」と、タイソン・トラウトマン(シニアディレクター・オブ・エンジニアリング)とロブ・サッター(エンジニアリングマネージャー)がブログ記事で述べています。
AIモデルは、入力できる量が限られています。これはコンテキストと呼ばれます。トークンで測定され、その量はモデルによって異なります。
たとえば、AnthropicのClaude Opus 4.7には1Mトークンのコンテキストウィンドウがあります。これは約555,000語、あるいは約250万のUnicode文字を収容できます。Claude Sonnet 4.6も1Mのコンテキストウィンドウを持っていますが、別のトークナイザに依存しているため、収容できるのは約750,000語、または約340万のUnicode文字です。
GoogleのGemma 4ファミリーのモデルでは、より小さいモデルはコンテキストウィンドウが128,000、大きいモデルは256,000です。
モデルのプロンプト用の容量としては十分に見えるかもしれませんが、実際には、毎回のプロンプトには追加のテキストが大量に付随します――システムプロンプト、システムツール、カスタムエージェント、メモリファイル、スキル、メッセージ、そしてauto-compact bufferです。したがって、利用可能な実際のコンテキスト容量は、10〜20%ほど少なくなる可能性があります。
プロンプトとレスポンスを「メモリ」として保存することで、会話の各ターン(プロンプト)ごとに必要とは限らない有用なチャットの詳細をオフロードする置き場を提供し、利用可能な容量を最大限に活かせます。
同時に、文脈が多ければ多いほど常に良いとは限りません。AIモデルは、与えられる文脈が少ないほうがより良い結果を出せる場合があるからです。つまり、メモリは、データを会話から引き出すための品質向上手段として、またストレージ管理オプションとしても、潜在的に有用です。
AIが会話を記憶できるようにするために、すでにさまざまなソフトウェア プロジェクトや統合メモリツールが用意されています。Cloudflareは、AIメモリはマネージドサービスであるべきだと提案しています。
- AnthropicがClaude Designをモックアップし、マーケティングチーム向けの華やかな新しいピンクスリップを作成
- Anthropicがシート契約からバンドルされたトークンを追い出して企業を絞り込む
- 注意データの収集家たちへ:音声機能が打ち切られ、AlexaのPlexへの魅力が失われる
- Claude Opusが2,283ドルのChromeエクスプロイトを書いた
TrautmannとSutterは、「実際のコードベースや本番システムに対して数週間、数か月走り続けるエージェントには、成長していくにつれて有用性が保たれるメモリが必要であり、新しいモデルのコンテキストウィンドウに丸ごと収まってしまう可能性のある、きれいなベンチマークデータセットでうまく動くだけのメモリではない」と述べています。その上で、これを、1クエリあたりの合理的なコストで迅速に実現でき、会話を妨げない形にできると論じています。
要するに、彼らが話しているのは非同期のCRUD操作です。たとえば、ユーザーの好みのパッケージマネージャ(例:pnpm)に関するメモリを保存した後、次のコマンドでそのメモリを呼び出せる可能性があります:
const results = await profile.recall("What package manager does the user prefer?");
console.log(results.result); // "The user prefers pnpm over npm."
エージェント・メモリはCloudflare Workerへのバインディング経由でアクセスできますが、Cloudflare Workerのエコシステム外の人向けにはREST APIでも利用可能です。現在、それはプライベートベータです。
また、AIチャットのログを誰かに見られたくないほど強いこだわりがある人のために、TrautmannとSutterは、メモリデータは顧客のものだという安心材料を提供しています。
「エージェント・メモリはマネージドサービスですが、あなたのデータはあなたのものです」と彼らは書いています。「すべてのメモリはエクスポート可能で、必要が変わったときに、Cloudflare上でエージェントが蓄積した知識をあなたの手元から持ち出せるようにすることに取り組んでいます。」
これは心温まる考えですが、会話のテキストを書き出したものを別のプラットフォームで機能する“メモリ”にするには、いくらか作業が必要になるかもしれません。®
関連記事
関連記事
より詳細なトピック
- AdBlock Plus
- AIOps
- API
- アプリ
- アプリケーションデリバリーコントローラー
- Audacity
- Confluence
- データベース
- DeepSeek
- FOSDEM
- FOSS
- Gemini
- Git
- Google AI
- GPT-3
- GPT-4
- Grab
- グラフィックス・インターチェンジ・フォーマット
- IDE
- 画像圧縮
- Jenkins
- 大規模言語モデル
- レガシーテクノロジー
- LibreOffice
- 機械学習
- 地図
- MCubed
- Microsoft 365
- Microsoft Office
- Microsoft Teams
- モバイルデバイス管理
- ニューラルネットワーク
- NLP
- OpenOffice
- プログラミング言語
- QRコード
- リトリーバル拡張生成
- レトロコンピューティング
- 検索エンジン
- ソフトウェア部品表
- ソフトウェアの不具合
- ソフトウェアライセンス
- スター・ウォーズ
- テンソル処理ユニット
- テキストエディター
- TOPS
- ユーザーインターフェース
- Visual Studio
より広い話題
詳細情報
詳細情報
詳細情報
より絞り込まれた話題
- AdBlock Plus
- AIOps
- API
- アプリ
- アプリケーション配信コントローラー
- Audacity
- Confluence
- データベース
- DeepSeek
- FOSDEM
- FOSS
- Gemini
- Git
- Google AI
- GPT-3
- GPT-4
- Grab
- グラフィックス交換形式
- IDE
- 画像圧縮
- Jenkins
- 大規模言語モデル
- レガシーテクノロジー
- LibreOffice
- 機械学習
- マップ
- MCubed
- Microsoft 365
- Microsoft Office
- Microsoft Teams
- モバイルデバイス管理
- ニューラルネットワーク
- NLP
- OpenOffice
- プログラミング言語
- QRコード
- 検索拡張生成
- レトロコンピューティング
- 検索エンジン
- ソフトウェア部品表
- ソフトウェアの不具合
- ソフトウェアライセンス
- スター・ウォーズ
- テンソルプロセッシングユニット
- テキストエディタ
- TOPS
- ユーザーインターフェース
- Visual Studio
- Visual Studio Code
- WebAssembly
- Webブラウザ
- WordPress




