Ang Li、Simular の CEO で、元 Google DeepMind の研究者でもある人物は、コンピュータ利用エージェントがエージェントの能力における重要なギャップを埋め、今後もおそらく常に必要になるだろうと主張している。
“80/20 の分割は常に存在すると考えています。すでにターミナルを使って多くの問題を解決できますが、 GUI(グラフィカル・ユーザー・インターフェース)で解決しなければならない問題は常に存在するでしょう”と彼は述べた。
「たとえば、医療保険のウェブサイトへ行きたい場合や、他のレガシーソフトウェアの場合、ターミナルエージェントがそのまま呼び出せる API を持っていないことが多いのです。」
それでも、AI ラボは概ね、コンピュータ利用エージェントからコーディングエージェントへの賭けを移しているようだ。コーディングを伴わないタスクでも、コーディングエージェントが他のアプリケーションを使う能力、ファイルを変更する能力、オーダーメイドのソフトウェアを作成する能力が、ユーザーにとってより有用になることが分かっている。例えば、予算の作成を手伝う必要がある人は、銀行取引明細をコーディングエージェントにアップロードし、それがユーザーの支出傾向を評価するのに役立つカスタムダッシュボードを作成させることができる。
OpenAI の幹部は、Codex を ChatGPT 内の汎用エージェントの動力として使いたいと述べている。 一方、Anthropic はすでにこれのバージョンを構築しており、それは Claude Cowork、Claude Code の派生版で、ユーザーがターミナルを開く必要がない。Perplexity はブラウザエージェントに大きく賭けてきたが、最近、同様の製品として Personal Computer。
コーディングエージェントは開発者の間で普及している一方で、追加機能が一般の人々の普及を促進するかどうかは不明だ。Google と OpenAI は、消費者が AI エージェントを使って Instacart から食料品を注文したり、ディナーの予約をしたりできると述べている。そうしたことは確かに便利そうだが、人々はエージェントが間違いを犯さないと確信できるまでは、こうしたタスクの自動化を望まないかもしれない。




