Cursor 3が並列エージェントを搭載して出荷、コミュニティは「良いのか」で割れている

Dev.to / 2026/5/1

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical UsageIndustry & Market MovesModels & Research

要点

  • Cursor 3(Glass)はスクラッチから作り直され、並列で動く「エージェント群」を管理することに焦点を当て、新しいAgents Windowが従来の1チャット/1エージェントの流れを置き換えます。
  • リリースにはクラウドへのエージェント引き継ぎが追加され、ローカル環境からクラウドVMへセッションを移して、完成したPRのような成果物ができるまで継続できます。
  • Cursor 3ではComposer 2が導入され、社内のコーディング用モデルをローカルで動かせるうえ、用途ごとのクラウド課金なし・利用制限の引き上げが示され、知能の提供形態が変わってきています。
  • /multitask(3.2で提供)は大きなタスクを分割して、リポジトリや環境をまたいで同時実行できるため、Cursorは従来のIDEというより「エージェント実行ランタイム」に近づいています。
  • この記事は、Hacker Newsなどでの議論に見られるように、並列かつ自律的なエージェント実行が開発者にとって良いことなのか、それとも制御面でのリスクがあるのかについて、コミュニティ内の意見が大きく割れている点を指摘しています。

Cursorは、コードを書くことではなく、AIエージェントの群れを管理することを中心に据えてゼロから作り直しました。デモはとても説得力があります。HNスレッドはぐちゃぐちゃです。そして誰かがたった2日で2,000ドルを使いました。重要なのはここです。

AIツールの分野を追っていない場合の簡単な背景:CursorはAnysphereによるVS Codeのフォークで、開発者コミュニティのかなりの部分で事実上のAIコーディングツールになり、今年の早い時期にARR 20億ドルに到達し、NVIDIA、Googleなどから30億ドル超を調達しました。「Copilotだけ使えばいいの?」と聞かれたときに、人々が勧めるツールです。

2026年4月2日、彼らは Cursor 3(社内コードネーム:Glass)をリリースしました。これはポイントリリースではありません。インターフェースをゼロから作り直しています。

売り文句はこうです。あなたがアーキテクトで、エージェントがビルダー。IDE自体はそのままありますが、デフォルト体験は「群れを管理すること」になりました。

発表から30分後にHacker Newsへ投稿されたとき、トップコメントは機能の話ではありませんでした。

実際に出荷されたもの

最大の変更点は Agents Window です。IDEと並行して動くフルスクリーンの作業空間で、複数のAIエージェントを同時に管理します。以前:チャットは1つ、エージェントは1つ、タスクも同時に1つ。今:異なるリポジトリ、ローカルマシン、worktree、SSH環境、クラウドVMまで、1か所から必要なだけ動かせます。

特に知っておくと良い点がいくつかあります:

クラウドへのハンドオフ は、残りの仕組みを「本物」にする機能です。ローカルでセッションを開始し、クラウドVMに渡して、ノートPCを閉じ、仕上がったPRで戻ってくる。これが「AIコーディングアシスタント」を、もう少し「非同期のエンジニアリングチーム」に近づける部分です。どうかは別の質問ですが。

Composer 2 はCursorの自社開発のコーディングモデルです。ローカルで動作し、使用のたびにクラウド料金がかからず、利用上限も高い。ここには彼らがそれを(あるいはそれをしないで)どう開示したかという話があります。後で触れます。

/multitask は、4月24日の3.2で出荷されました。大きなタスクをチャンクに分け、それをサブエージェントの群れに同時に投げます。リポジトリをまたぐことも可能です。ここから「エージェント実行ランタイム」という見立てが、単なる願望ではなく正確に感じられてくる――そしてCursorがIDEというより、会話で操作するCI/CDレイヤーのように見え始める――のはここです。

MCP Marketplaceがそれを締めくくります。Cursorは静かにプラットフォームへ変わりつつあります。機能面だけでなく、ロックイン面でも重要です。

哲学の転換と、コミュニティの半分が不満な理由

Cursorの共同創業者たちは、このリリースを「ソフトウェア開発の3つの時代」で語りました。第1時代:ファイルを手で編集する。第2時代:エージェントがコードの大半を書くが、あなたが指示する。第3時代:エージェントの群れが自律的に改良を出荷し、あなたはレビューする。

彼らは今が第2時代で、そこから第3へ向けて作っていると賭けています。インターフェースはそれを反映しています。

ローンチ当日のHNトップコメント:

"開発者が運転して、エージェントが補助するという昔の哲学を続けてほしい。私はまだコードを書きたいんです。チケットに雰囲気で対応するようなことはしたくない。"

Cursorのエンジニアは数分以内に返信しました――IDEはまだある、Agents Windowは別の画面で、両方を同時に開くことも、エージェントを完全に無視することもできる。どちらも事実です。でも、彼らが実際に言い争っているのは機能ではなく、「その仕事が何であるべきか」です。

その噛み合わなさこそが、ここでの本当の話です。出荷された機能の話ではありません。Anysphereが、ソフトウェア開発がどこへ向かうと考えているか、そして開発者がその枠組みに同意するのか――そこが問題です。Cursorを使う多くの人は、まさにコードに近い距離を保ちたいからそこにいる。エージェント優先の売り文句は、彼らにとっては「自分が求めていない方向へ向かうツール選び」に見えてしまうんです。

反発するのも間違っていません。なぜならCursor 3が本当に提案しているのは、あなたの既存の仕事の上にさらに自動化を足すことではないからです。別の仕事を提案しているのです。コードを書くことと、並行して動く複数の半自律システムのアウトプットを管理することは、同じ技能ではありません。使う思考モデルが違い、レビューの勘所も違い、デバッグのアプローチも違う。ひとつは「著者として書く」こと。もうひとつは、単一の正しい情報源がなく部分的な情報しかない状況で、規模の大きいコードレビューに近い。

「群れをオーケストレーションする」は、「システムソフトウェアを書く」のより生産的なバージョンではありません。別の働き方です。Cursor 3は、どちらのモードがより重要かについて強い見解を持っています。あなたがそれを共有しているとは限りません。

Composer 2の状況

Cursorは、初期の発表でComposer 2がどのモデルに基づいて作られているのかを開示していませんでした。外部の開発者がシステム応答内で識別子 kimi-k2p5-rl-0317-s515-fast を見つけ、Moonshot AIのKimi K2.5に辿り着きました。

共同創業者のAman Sangerは、この省略を「ミス」だとし、今後のリリースでは基盤モデルを最初から開示すると述べました。Moonshot AIは、Fireworks AIを通じた認可された商用パートナーシップであることを確認しました。Composer 2の総計算量の約75%は、基盤の上にCursor自身が継続的に行った事前学習と強化学習から来ています。つまり単なる看板の付け替えではありません。ただし、事前の開示がなかったことの評価はあまり良くありませんでした。

ベンチマークについて:Composer 2はTerminal-Bench 2.0で61.7、Opusの58.0に対し、GPT-5.4は75.1です。GoogleのAntigravityはSWE-bench Verifiedで76.2。Cursorは競合に対して十分に戦えるものの、先頭にいるわけではありません。これは、守るべき自社モデルができた今となって、より重要になります。

とはいえ、上振れも本物です。ローカル実行、使用のたびのクラウド料金なし、あらゆる処理をフロンティアモデルに振り向けるより高い利用上限。CursorでClaudeクレジットを燃やしていた人にとっては、標準的な作業における意味のあるコスト軽減になります。

コストの話は“脚注”ではない

ここが最も多くの人に無視されます。請求が来るまで。

Cursorの料金ページには4つの階層が載っています:Free、$20/月のPro、$60のPro+、$200のUltra。数字は問題なさそうに見えます。問題は、クラウドエージェントが料金ページが示唆するような形でメーター管理されていないことです。

HNの早期導入者は、クラウドエージェントの実行に$2,000+使ったと報告しています。$2,000/月ではありません。2日間。 あるユーザーはCursorで$1,800/月から、Claude Codeでおよそ$200/月に切り替え、「"金額に対する価値がWAY better"」と述べました。別の人は切り替える前に「"プレミアムモデルで週2k"」だったと報告しています。

クラウド実行のVM課金(1分あたり)は料金ページに開示されていません。請求が届いて初めてわかります。

比較:Claude Code Maxは月額固定$100〜200で、worktreeによる並列実行が可能です。重たいエージェント的作業をしているなら、計算はごまかせません。

Composer 2によるローカルエージェントには、使用のたびの課金がありません。これは標準的なタスクに対する想定利用です。クラウドエージェントこそが本当のパワーのある領域(夜間実行、モバイル起動のタスク、複数リポジトリの並列)で、かつコストが不透明な領域でもあります。表示されている階層が実際に支払う金額だと決めつける前に、丸1週間分の支出を追跡してください。

機能は本物です。適切なワークロードに対して価値も本物。ですが、料金モデルはデモに合わせて設計されており、実際に1週間回したときに起きることには合わせていません。

どの位置づけか

今年、AI IDEの領域は急速に統合が進みました。知っておきたい3つの明確な思想の違いがあります:

Cursor 3 ― IDEネイティブで、GUI優先、そして今やエージェント優先。視覚的なツール、管理UIつきの並列エージェント、そしてブラウザを注釈して「この点を直して」とエージェントに伝える能力が欲しいなら、そのワークフローが最も成熟しているのがCursorです。コスト:表示は$20/月で、実際には変動があります。

Claude Code -- ターミナルネイティブで、邪魔をしません。GUIはなく、既存のターミナル上で動作し、すでに使っているどんなエディタとも統合できます。すべてをIDEラッパーで包みたくない人向けの、完全自律的なエージェント作業については、まだ先を進んでいます。Maxティアで月額$100-200。

Google Antigravity -- ワイルドカード。スクラッチから構築(VS Codeのフォークではありません)。Googleが2.4Bドルで買収したチームが制作し、2025年11月に無料で出荷。SWE-bench Verifiedで76.2%で、現時点でコーディングエージェントに関して最も高い公表数値の一つです。無料。まだ見ていないなら週末の価値ありです。

ForgeCode -- オープンソース、ターミナルベース。自分のAPIキーを持ち込む方式。81.8%でTerminal-Bench 2.0を制しました。1位を取ったことについてのブログ記事のタイトルは「benchmarks don't matter(ベンチマークは重要ではない)」で、あなたの前提によっては良い兆しか悪い兆かのどちらかです。こちらも週末の価値あり。

これは実際に何を意味するのか

「あなたが建築家で、エージェントが施工者」という枠組みは、これからも繰り返し出てきます。Cursor 3は、主要なツールの中でもその方向性を最も明確に述べた発言ですが、それが唯一というわけではありません。Antigravity、Claude Code、Codex――どれも同じメンタルモデルへ収束しています。

システムソフトウェア、CLIツール、あるいは「なるべくハードに近いところに張り付いている」必要があるものを作る人が、腰を据えて考えるべき問いはこれです。エージェントのオーケストレーションは、実際にそのワークフローを助けるのか。それとも主に「プロンプトからCRUDアプリを生成する」ワークフローに役立ち、その他の作業には副作用として少しだけ効いているにすぎないのか。

率直な見立てです。並列エージェントは、境界がはっきりしていて、独立した表面領域を持つタスクには本当に有用です。3つのエージェントを3つの別々の機能で立ち上げ、PRをレビューし、うまくいったものをマージする。それは本物です。全体として、面倒で厄介な問題を一つずつ丁寧に考えていることが要点になるような深いシステム作業では、何かを分隊に渡しても速くはなりません。むしろノイズが増えます。節約できたはずの時間を、もっと後になって初めて問題が露呈する、尤もらしいけれど間違っているエージェント出力のレビューに費やしてしまうからです。

いずれ到達します。ベンチマークの進歩が十分に速いので、「システム作業には効かない」はおそらく2026年の発言であって、永久にそうだという主張ではないでしょう。ですが現時点では、並列エージェントが主に役立つのは、正しさが検証可能で、問題がきれいに分解できる、ある程度制約のあるタスクです。それは確かなカテゴリの仕事です。ただし、仕事のすべてではありません。

より興味深いのは、その下にある変化です。Cursor 3は、機能としての「並列エージェント」そのものを主張しているわけではありません。ツールが前提としている「仕事の形」が何か、ということへの話です。そしてツールがすべて「エージェントを管理する。コードを書くのではない」という方向に収束していくなら、押し返している開発者たちは変化に抵抗しているのではなく、誰も「それが本当に自分がやると契約した仕事なのか」を確認しなかったことに気づいているだけです。

深掘りするならここ

  • Cmd+Shift+P -> Agents Window -- Cursor 3の並列エージェントUIを試す
  • cursor.com/changelog -- 提供スピードが速いので追う価値あり
  • GitHubのForgeCode -- bring-your-own-keys、オープンソース。クローズドなツール導入の方向性に懐疑的なら見てみる価値あり
  • Google Antigravity -- 無料、エージェント前提、VS Codeのフォーク由来の面倒さなし

いまのあなたのセットアップは?Cursor、Claude Code、あるいはまったく別の何かですか?そして実際に並列エージェントを本番環境で回したことがあるなら――コストはどうなりましたか?コメント欄に書いてください。本当に、人々がどこに落ち着くのか興味があります。