AWSが仮想クラウドデスクトップをエージェントに操作させるように—ただしクリック1回で最大50万トークン級のコストも

The Register / 2026/5/6

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsIndustry & Market Moves

要点

  • AWS WorkSpacesの仮想デスクトップに対して、エージェントが操作できるようにする取り組みが進んでいると報じられています。
  • 記事では、その操作が「クリック1回あたり最大50万トークン」といった非常に大きな推定コストにつながり得る点が強調されています。
  • 一方で、ベンダーのベンチマークでは、適切に設計されたAPIを使うことで同じ作業をより速く、より安く実行できる可能性が示されています。
  • このため、エージェント駆動のデスクトップ自動化では、UI操作の代替としてAPI連携を組み込む設計がコスト面で重要になります。

AWSはエージェントにバーチャルなクラウドデスクトップを運転させます - クリック1回あたり最大500,00トークンの可能性も

ベンダーのベンチマークでは、APIにより作業をより速く、より安く行えることが判明

Wed 6 May 2026 // 05:08 UTC

Amazon Web Servicesは、AIエージェントをクラウド上のWorkSpaces仮想PCに解き放ちました。

新サービスは現在プレビュー中で、AmazonのIdentity and Access Managementサービスを使って、ユーザーがエージェントにIDを割り当てられるようにします。そうした資格情報を用いることで、エージェントは固有の事前署名付きURLを通じてWorkSpaceにアクセスし、クラウド上のPCで動作している任意のアプリを操作できます。

AWSの広報担当者によれば、同社のクラウドの巨大システムは、開発者には各エージェントに固有のIDを付与することを推奨しています。そうすることで、エージェントの活動を追跡しやすくなり、エージェントによる“エージェント的な行動”と、人間が行った活動を見分けやすくなるためです。

また、エージェントは「スクリーンショット、マウス操作、テキスト入力といったデスクトップツールへの、統制されたアクセスを提供するマネージドMCPエンドポイント経由で接続する」とも伝えられています。これは、裏を返せば「開発者に対し、エージェントがデスクトップとやり取りするための制御されたインターフェースを提供しつつ、実行できるアクションに関するガードレール(制約)を維持する」ことになるようです。

エージェントに独自のPCを与える主な理由は、さまざまなタスクを自動的に実行するためのソフトウェアを使えるようにすることです。クラウド上または仮想PCは、この用途に適しています。なぜなら、これらはエフェメラル(使い捨て)にできるからです。つまり、エージェントが用事を終えるのに十分な時間だけ起動しておき、あとは停止できます。エージェントを隔離された仮想プライベートクラウド内に置くことは、LANやデータセンターで自由に活動させるよりも望ましい場合もあるかもしれません。物理PCだけに全面的に依存している組織、あるいはローカルマシン上でVMを操作させることを好まない組織にとっても、オンプレミスの仮想PCを構築するための複雑さを避けられる分、クラウドPCを選ぶ方がよい可能性があります。

AWSは、WorkSpacesサービスが提供する数多くのインスタンスタイプへのエージェントによるアクセスを可能にします。しかもそれらは、小型のインスタンス(仮想CPU 1個とメモリ2GB)から、GPUを搭載し、仮想CPU 32個、メモリ256GBを備えた大型の高性能機まで幅広く用意されています。Amazonは、ノンストップアクセスを可能にする月額の定額料金、または小さめの料金に加えて時間課金のどちらかで、すべてのWorkSpacesをレンタルしています。

エージェントがクラウドPCを操作することを許しているのはAmazonだけではありません。Microsoftも、Windows 365サービスのエージェント向けのバージョンを作成しました。

エージェントはコンピュータビジョンを使ってPCを操作します。通常、デスクトップのスクリーンショットまたは動画を撮影し、そこから「見えているもの」を解釈してからアクションを実行します。クリック、入力、スクロールを行う許可を与えられていると仮定しているわけです。

AIコーディング企業Reflexは、そのような作業に必要な労力は簡単ではないと考えています。同社は最近、ブラウザ利用のビジョンエージェントが、ドロップダウンメニューをクリックするのに50万トークン相当必要だったと主張し、さらにエージェントを使うと、構造化APIを使うよりも45倍高くつく可能性があると結論づけました。

同社は、そのアプローチで同じ結果が得られるかをテストできるように、ベンチマークツールをGitHubで公開しています。

Reflexのブログでは、成長責任者パラシュ・アワスティが、より良いAIモデルがいずれコストを下げるだろうことを認めています。しかし彼は、エージェントを使う場合はAPIを使うよりも、ジョブを完了するまで常に多くのステップが必要になると主張しています。

つまり、クラウドデスクトップを借りる前に、まずはこれを確認してみるのがいいかもしれませんね。®

More like these
×

さらに詳しく

これらに近い内容
×

ニュースをお知らせください

ニュースを送ってください