Anthropicはエージェントの“記憶”、評価、オーケストレーションを握りに来ている——そしてそれは企業に不安を与えるべきだ

VentureBeat / 2026/5/9

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsIndustry & Market Moves

要点

  • Anthropicは、Claude Managed Agentsの発表から間もなく、Dreaming、Outcomes、Multi-Agent Orchestrationの3つの機能を追加し、メモリ、評価、オーケストレーションを単一の実行環境に統合しました。
  • Dreamingはセッション横断でエージェントに“振り返り”を行わせ、記憶を編集して未知のパターンを引き出すことを狙い、Outcomesはエージェントの成功を測るためのルーブリック定義をチームに提供します。
  • Multi-Agent Orchestrationはタスク分解と委任を可能にし、複雑な作業での手作業による誘導を減らすことを目指しています。
  • 記事では、すべてを1つで提供する方針が、LangGraphやCrewAIのようなモジュール型構成、RAGのメモリアーキテクチャ、評価/QAループといった既存スタックを脅かしうると警告しています。
  • 実行やメモリを企業が自社で保有できない形でAnthropic側のホスト環境に集約するため、ベンダーロックインやデータレジデンシ(データ所在)に関するコンプライアンス面の懸念が強まる可能性があります。

Claude Managed Agents を発表してからわずか数週間後

」Anthropicは、3つの新しい機能でプラットフォームを更新しました。これにより、メモリ、評価、多アジェントのオーケストレーションといったインフラ層を崩し、単一のランタイムにまとめ上げています。

この動きは、既に多くの企業が寄せ集めて作っているスタンドアロンのツールに脅威を与える可能性があります。

新しい機能――「'Dreaming,'」「'Outcomes,'」「'Multi-Agent Orchestration'」――は、Claude Managed Agents 内のエージェントを「最小限の介入で複雑なタスクをより適切に扱えるようにする」ことを目指していると、Anthropicはプレスリリースで述べました。  

Dreamingはメモリを扱います。エージェントが「多くのセッションを振り返り」、記憶を取捨選択して学習し、未知のパターンを見つけられるようにする、というものです。Outcomesは、チームがエージェントの成功を測るための具体的なルーブリックを定義し設定できるようにします。さらにMulti-Agent Orchestrationは、仕事を分解してリードエージェントが他のエージェントへ委任できるようにします。

Claude Managed Agentsは理想的には、企業にとってエージェントを導入するためのよりシンプルな道筋を提供し、オーケストレーションのロジックをモデル層に組み込むものです。状態、実行グラフ、ルーティングを管理するエンドツーエンドのプラットフォームです。Dreaming、Outcomes、そしてMulti-agent Orchestrationの追加により、Claude Managed Agentsはさらに機能を拡張し、LangGraphやCrewAIのようなツール、ならびに外部評価フレームワーク、RAGメモリアーキテクチャ、QAループとも直接競合するようになります。

統合による脅威

企業は今、次の問いを迫られます。――「ほぼすべてを社内に持ち込むエージェント・プラットフォーム」のために、柔軟でモジュール化された自分たちの仕組みを捨てるべきなのでしょうか?

Anthropicは、Claude Managed Agentsが文脈、状態、追跡可能性(traceability)を一箇所で共有できるように設計しました。つまり、企業が別々のシステムをつなぎ合わせる必要はなく、プラットフォームがエージェントの行うあらゆる判断を把握しています。すべてを1つのプラットフォームで済ませられるのは現実的に思えます。しかし、すべての企業がフルサービス型のシステムを望んでいるわけではありません。 

Claude Managed Agentsは既に、ベンダーロックインを助長すると批判されています。というのも、エージェントを統治するアーキテクチャやツールの大部分を同社が所有しているからです。現在のパラダイムでは、組織はManaged Agentsを動かしていても、多アジェントのオーケストレーション、メモリ、あるいは評価を別の領域で維持すれば、柔軟性を確保できます。 

プラットフォームはフルホスト型のランタイムを提供します。つまり、メモリとオーケストレーションは、企業が所有していないインフラ上で実行されることになります。これは、データの所在(data residency)を証明しなければならない一部の組織にとって、コンプライアンス上の悪夢になり得ます。

もう一つ考慮すべき問題は、大規模なAI変革の真っ最中にある企業は、技術スタックの制約に対処するために、すでに回避策を寄せ集めて構築しているという点です。すべてのワークフローが、Claude Managed Agentsに切り替えるだけで簡単に置き換えられるわけではありません。

Dreamingとoutcomesは、現在のツールに対してどうか

ほとんどの企業は、AI導入に対して分断されたアプローチをとっています。

たとえば、LangGraphやCrew AIをエージェントのルーティングとワークフロー管理に使い、Pineconeを長期メモリのベクトルデータベースとして使い、DeepEvalで外部評価を行い、そして一部のタスクを人の目でレビューする人間同在(human-in-the-loop)の品質保証を実施している場合があります。Anthropicは、それらをすべてなくしたいと考えています。

Dreamingにより、Anthropicはメモリに対して、セッション間でユーザーが能動的に書き換えられるようにすることでアプローチします。これにより、エージェントは本質的に自分の失敗から学習することになります。Anthropicは、この機能が長期間にわたる状態やオーケストレーションに有用だと述べています。現行のシステムは、多くの場合、メモリ永続化を、埋め込み(embeddings)を保存して関連する文脈を取り出し、時間の経過とともにさらに状態を追加して実現しています。

Outcomesは、評価の部分を、エージェントに期待することを具体的に記述することで扱います。人のチームによって行われがちな外部の品質チェックの代わりに、Anthropicは評価をその上に積み上げるのではなく、オーケストレーション層に組み込もうとしています。

ただし、Claude Managed AgentsをMicrosoft、LangChain、CrewAIなどのオーケストレーション・フレームワークと真正面から競わせているのが、Multi-Agent Orchestration機能です。AnthropicやOpenAIのようなモデル提供者は、すでにこの領域へ精力的に踏み込んでおり、これをモデル層にもたらすことでチームのコントロールがより良くなると主張しています。

決断すべき大きなポイント

企業には大きな意思決定があります。そして、その内容は、エージェントの成熟度がどの段階にあるかに左右される可能性があります。

もし組織がまだエージェントを試験的に扱っており、本番環境に多数導入していないのであれば、Claude Managed Agentsへ移行し、DreamingとOutcomesを自分たちのニーズに合わせて設定するのは、より簡単に感じられるかもしれません。この段階では、たとえLangChainのようなサードパーティのオーケストレーターを利用していても、それをまだカスタマイズしている状態にあります。

しかし、プロセスをさらに進めている企業にとっては、判断はより複雑になります。いま必要なのは並行した評価であり、そして自社のプロセスをより深く理解することだからです。

とはいえ、企業はClaude Managed Agentsを使うつもりがなくても、同じような決断を迫られるでしょう。Anthropicは、他のモデルやプラットフォーム提供者も、製品ロードマップを同様のモデルへ移していく可能性が高いことを示唆しています。つまり、すべてが同一のシステムにロックされたままになる形です。モデルは互換的になるかもしれませんが、ツール群やオーケストレーションのインフラはそうならないからです。