Cloudflareは“まとめて”記憶してくれる

The Register / 2026/4/18

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

原文を読む →

共有:

要点

Cloudflareは「Agent Memory」を導入し、AIチャットのやり取りから得た断片を別に保存し、必要なときに呼び出せるようにすることを目的としている。
その狙いは、直近のプロンプトだけに頼らず、関連する過去の文脈を思い出すことでAIエージェントに継続性を持たせる点にある。
Agent Memoryは、複数ステップにまたがる作業や、ユーザー／エージェントの過去のやり取りを参照する必要があるケースで、より有用なエージェント挙動を支えることを目指している。
今回の発表は、Cloudflareがクラウド／エッジ基盤の中にAIを支える機能を組み込もうとしている姿勢を示している。

AI + ML

Cloudflareはそれをあなたのために一括で記憶できます

エージェントメモリはAIチャットの断片を脇に保存し、必要なときに呼び出します

Thomas Claburn

Sat 18 Apr 2026 // 08:30 UTC

ハードウェアのメモリが不足しがちなだけでなく、コンテキストメモリ――AIモデルとやり取りされる会話データ――も問題になり得ます。

この特定の課題に対するCloudflareの答えが「エージェントメモリ」です。スペースが限られているときにAIの会話を退避（サイフォン）し、必要に応じてデータを注入（戻し込み）するマネージドサービスです。

「エージェントAIに永続的なメモリを与え、重要なものを思い出し、不要なものは忘れ、時間とともに賢くなることを可能にします」と、タイソン・トラウトマン（シニアディレクター・オブ・エンジニアリング）とロブ・サッター（エンジニアリングマネージャー）がブログ記事で述べています。

AIモデルは、入力できる量が限られています。これはコンテキストと呼ばれます。トークンで測定され、その量はモデルによって異なります。

たとえば、AnthropicのClaude Opus 4.7には1Mトークンのコンテキストウィンドウがあります。これは約555,000語、あるいは約250万のUnicode文字を収容できます。Claude Sonnet 4.6も1Mのコンテキストウィンドウを持っていますが、別のトークナイザに依存しているため、収容できるのは約750,000語、または約340万のUnicode文字です。

GoogleのGemma 4ファミリーのモデルでは、より小さいモデルはコンテキストウィンドウが128,000、大きいモデルは256,000です。

モデルのプロンプト用の容量としては十分に見えるかもしれませんが、実際には、毎回のプロンプトには追加のテキストが大量に付随します――システムプロンプト、システムツール、カスタムエージェント、メモリファイル、スキル、メッセージ、そしてauto-compact bufferです。したがって、利用可能な実際のコンテキスト容量は、10〜20％ほど少なくなる可能性があります。

プロンプトとレスポンスを「メモリ」として保存することで、会話の各ターン（プロンプト）ごとに必要とは限らない有用なチャットの詳細をオフロードする置き場を提供し、利用可能な容量を最大限に活かせます。

同時に、文脈が多ければ多いほど常に良いとは限りません。AIモデルは、与えられる文脈が少ないほうがより良い結果を出せる場合があるからです。つまり、メモリは、データを会話から引き出すための品質向上手段として、またストレージ管理オプションとしても、潜在的に有用です。

AIが会話を記憶できるようにするために、すでにさまざまなソフトウェアプロジェクトや統合メモリツールが用意されています。Cloudflareは、AIメモリはマネージドサービスであるべきだと提案しています。

TrautmannとSutterは、「実際のコードベースや本番システムに対して数週間、数か月走り続けるエージェントには、成長していくにつれて有用性が保たれるメモリが必要であり、新しいモデルのコンテキストウィンドウに丸ごと収まってしまう可能性のある、きれいなベンチマークデータセットでうまく動くだけのメモリではない」と述べています。その上で、これを、1クエリあたりの合理的なコストで迅速に実現でき、会話を妨げない形にできると論じています。

要するに、彼らが話しているのは非同期のCRUD操作です。たとえば、ユーザーの好みのパッケージマネージャ（例：pnpm）に関するメモリを保存した後、次のコマンドでそのメモリを呼び出せる可能性があります：

const results = await profile.recall("What package manager does the user prefer?");

console.log(results.result); // "The user prefers pnpm over npm."

エージェント・メモリはCloudflare Workerへのバインディング経由でアクセスできますが、Cloudflare Workerのエコシステム外の人向けにはREST APIでも利用可能です。現在、それはプライベートベータです。

また、AIチャットのログを誰かに見られたくないほど強いこだわりがある人のために、TrautmannとSutterは、メモリデータは顧客のものだという安心材料を提供しています。

「エージェント・メモリはマネージドサービスですが、あなたのデータはあなたのものです」と彼らは書いています。「すべてのメモリはエクスポート可能で、必要が変わったときに、Cloudflare上でエージェントが蓄積した知識をあなたの手元から持ち出せるようにすることに取り組んでいます。」

これは心温まる考えですが、会話のテキストを書き出したものを別のプラットフォームで機能する“メモリ”にするには、いくらか作業が必要になるかもしれません。®