Amazon Bedrock AgentCore Browserに「OSレベルのアクション」を導入
Amazon AWS AI Blog / 2026/5/6
📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- Amazon Bedrock の AgentCore Browser は「OSレベルのアクション」を導入し、InvokeBrowser API を通じてエージェントが OS を直接制御できるようになります。
- これにより、エージェントはブラウザのウェブ層だけでなく、画面に表示されるネイティブUI要素にも対して操作できる範囲が広がります。
- 同機能は、フルデスクトップのスクリーンショットと OS レベルのマウス/キーボード操作を組み合わせ、同一セッション内で観察・推論・実行を可能にします。
- 投稿では OSレベルのアクションの仕組み、対応しているアクション、導入方法が説明されます。
AgentCore Browser の OS レベル アクションを発表します。この新機能により、InvokeBrowser API を通じて OS の直接的な制御を公開することで、これらのシナリオが解消されます。そのため、エージェントはブラウザのウェブ層を介してアクセス可能なものだけでなく、画面に表示されているコンテンツともやり取りできます。OS レベルでのマウスおよびキーボード制御と、フルデスクトップのスクリーンショットを組み合わせることで、エージェントはネイティブ UI を観察し、それについて推論し、同一セッション内でそれに対して行動できます。本記事では、OS レベル アクションの仕組み、サポートされているアクション、そして始め方を説明します。




