広告

エンタープライズ・オートメーションにはターミナル型エージェントで十分

arXiv cs.AI / 2026/4/2

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 本論文は、エンタープライズのオートメーション・エージェントは、Webエージェントのような複雑なGUIベースや、MCP型の抽象化といったプロトコル層のアーキテクチャを必ずしも必要としないと主張する。
  • ターミナルとファイルシステムに制限されたコーディング・エージェントは、プラットフォームのAPIを直接呼び出すことで、多くのエンタープライズ業務をより効果的に達成できることを提案している。
  • 複数の実世界のシステムにまたがる実験の結果、「ターミナルのみ」のエージェントは、より複雑なエージェント設計に匹敵する、あるいは上回ることが分かった。
  • 著者らは、シンプルなプログラマブル・インターフェースと強力な基盤モデルを組み合わせるだけで、実用的かつコストを意識したエンタープライズ・オートメーションが実現できると結論づけている。

概要: 自律的に重要なエンタープライズ業務を遂行できる、デジタル・プラットフォームと相互作用するエージェントの構築に対する関心が高まっている。検討されているアプローチには、Model Context Protocol(MCP)などの抽象化に基づくツール拡張型エージェントや、グラフィカル・インターフェイスを通じて動作するウェブエージェントがある。しかし、これらの複雑なエージェント型システムが、そのコストや運用上のオーバーヘッドを踏まえて、本当に必要なのかは依然として不明である。私たちは、端末とファイルシステムのみを備えたコーディング・エージェントなら、プラットフォームのAPIと直接やり取りすることで、多くのエンタープライズ業務をより効果的に解決できると主張する。この仮説を、多様な実世界のシステムにわたって評価し、その低レベルの端末エージェントが、より複雑なエージェント・アーキテクチャと同等かそれ以上の性能を発揮することを示す。これらの結果は、強力な基盤モデルと組み合わせることで、単純なプログラマブルなインターフェースだけでも、実用的なエンタープライズ自動化には十分であることを示唆している。

広告