プロンプトチェーンをつなぎ合わせ、シャドーエージェントを用いる企業の時代は終わりに近づいています。複雑なマルチエージェントシステムをオーケストレーションするための選択肢が増えてきたためです。組織がAIエージェントを本番環境へ移すにつれて、なお残る問いは「私たちはそれらをどう管理するのか?」です。
GoogleとAmazon Web Servicesは、AIスタックの分岐を示すように、根本的に異なる答えを提示しています。Googleの方針は、エージェント型のマネジメントをシステム層で実行すること。一方でAWSのハーネス活用の方法は、実行層で仕組みを組み立てるというものです。
エージェントをどのように管理し制御するかをめぐる議論は、今月になって新たな活力を得ました。競合する企業がエージェントビルダーのプラットフォームをリリースまたは更新したからです。Anthropicは新しいClaude Managed Agentsを、OpenAIはAgents SDKの強化を発表し、開発チームがエージェント管理の選択肢を得られるようになりました。
Bedrock AgentCoreに新機能を追加したAWSは、速度を最適化しています。ハーネスを使って、エージェントをより早く製品に投入することに依存しつつ、アイデンティティとツール管理も提供します。
その一方で、GoogleのGemini Enterpriseは、Kubernetes型のコントロールプレーンを用いたガバナンス重視のアプローチを採用しています。それぞれの方法は、エージェントが短時間のタスク支援者から、ワークフロー内でより長く稼働する存在へと移行していく様子を垣間見せてくれます。
アップグレードと傘
各社がどこに立っているのかを理解するために、実際に新しくなった点を整理します。
GoogleはGemini Enterpriseの新バージョンをリリースし、エンタープライズ向けAIエージェント提供であるGemini Enterprise PlatformとGemini Enterprise Applicationを1つの傘の下にまとめました。
同社はVertex AIをGemini Enterprise Platformとして名称変更しましたが、名前の変更と新機能を除けば、基本的なインターフェースは同じだと主張しています。
「私たちは、企業がGoogleが提供するすべてのAIシステムとツールにアクセスできるように、プラットフォームと“玄関口”を提供したいのです」と、Gemini Enterpriseのプロダクトマネジメント上級ディレクターであるMaryam Gholamiは、インタビューでVentureBeatに語りました。「考え方としては、Gemini Enterprise ApplicationはGemini Enterprise Agent Platformの上に構築されており、セキュリティとガバナンスのツールはGemini Enterprise Applicationのサブスクリプションに含まれて無償で提供される、ということです。」
一方で、AWSはBedrock Agentcoreに新しいマネージドエージェントハーネスを追加しました。同社は、VentureBeatと共有されたプレスリリースの中で、そのハーネスは「Strands Agents(AWSのオープンソースのエージェントフレームワーク)を動力にした、設定ベースのスタート地点によって、事前のビルドを置き換える」ものだと述べています。
ユーザーが、エージェントが何をするのか、使用するモデル、呼び出すツールを定義すると、AgentCoreがそれらをすべてつなぎ合わせてエージェントを実行する作業を行います。
エージェントは今、システムになりつつある
ステートフルで長時間稼働する自律エージェントへの移行は、AIシステムがどのように振る舞うべきかを改めて考えさせることになりました。エージェントが短命のタスクから、長時間のワークフローへと移るにつれて、新たな失敗のクラスが現れています。それが「ステート・ドリフト」です。
エージェントが稼働し続ける中で、状態(メモリ、応答、そして変化し続ける文脈)が蓄積されます。そして時間の経過とともに、その状態は古くなっていきます。データソースが変わったり、ツールが相反する応答を返したりすることがあります。しかし、エージェントは不整合に対してより脆弱になり、真実味が薄れていきます。
エージェントの信頼性はシステムの問題になり、ドリフトの管理には、より速い実行以上のものが必要になるかもしれません。可視性と制御が必要になる可能性があります。
Gemini EnterpriseやAgentCoreのようなプラットフォームが、この失敗ポイントを防ごうとしているのはまさにそこです。
この変化はすでに起き始めていますが、Gholamiは、顧客がどのように長時間稼働するエージェントを実行し制御したいのかを決めることになるだろうと認めています。
「私たちは、長時間稼働するエージェントをどのように使うのか、つまり、これらの自律エージェントにタスクを割り当てて、ただ実行させるのか、という点で顧客から多くを学ぶことになると思います」とGholamiは述べました。「もちろん、正しく調整するための“コツ”や“バランス”はありますし、エージェントが戻ってきて追加の入力を求めることもあるでしょう。」
新しいAIスタック
ますます明らかになっているのは、AIスタックが明確な層に分かれていき、それぞれ異なる課題を解決しているということです。
AWS、そしてある程度AnthropicやOpenAIも、より速いデプロイのために最適化しています。Claude Managed Agentsは、エージェントを立ち上げるためのバックエンド作業の大半を抽象化し、Agents SDKは現在、サンドボックスと既製のハーネスのサポートを含んでいます。これらのアプローチは、エージェントを立ち上げて稼働させるまでの障壁を下げることを狙っています。
Googleは、アイデンティティを管理し、ポリシーを強制し、長時間の振る舞いを監視するための中央集権的なコントロールパネルを提供しています。
企業はおそらく両方を必要とするでしょう。
一部の実務者の見立てでは、企業は「どれほどのリスクを引き受ける用意があるのか」について、きちんとした議論をしなければならない、ということです。
「現時点でこれらのテクノロジーを検討するエンタープライズのテクノロジーリーダーへの主な持ち帰りは、次のように定式化できるかもしれません。すなわち、エージェントハーネスとランタイムの問題はしばしば“作るか買うか”の話として捉えられがちですが、これは主にリスク管理の問題だ、ということです。収益ストリームに影響しないためにサードパーティのランタイムでエージェントを動かしても費用を賄えるなら、それで問題ありません。逆に、より重要なプロセスの文脈では、ビジネスの観点から考えると後者の選択肢だけが検討対象になるでしょう」と、EZContactsの成長責任者であるRafael Sarim Oezdemirは、電子メールでVentureBeatに語りました。
素早く反復することでチームは実験し、エージェントが何をできるのかを発見できます。一方、中央集権的な制御は信頼の層を追加します。企業に必要なのは、エージェントを実行するための“単一のやり方だけ”を前提に設計されたシステムにロックインされないようにすることです。
