AI Navigate

Cursorの新しいコーディングモデル Composer 2 が登場—Claude Opus 4.6 を上回るが GPT-5.4 にはまだ及ばない

VentureBeat / 2026/3/20

📰 ニュースTools & Practical UsageIndustry & Market MovesModels & Research

要点

  • Cursor が自社開発のコーディングモデル Composer 2 および Composer 2 Fast を発表。Cursor のエージェント主導のワークフロー向けに設計され、Composer 1.5 に比べてベンチマークを大幅に改善。
  • Composer 2 Standard は 1M トークンの入力あたり 0.50 ドル、出力あたり 2.50 ドル、Composer 2 Fast は 1M トークンの入力あたり 1.50 ドル、出力あたり 7.50 ドル。キャッシュ読み取り割引によりコストをさらに削減し、Composer 2 は Composer 1.5 より約 86% 安く、Fast は約 57% 安くなります。
  • このリリースは長期的な、ツール主導のコーディングを重視しており、200,000 トークンのコンテキスト窓と、ワークフロー全体で数百のアクションを要するタスクに対応する訓練を特徴としています。
  • このモデルは Cursor 専用で、Cursor のツールスタックと統合されており、広範な外部 API や独立したプラットフォーム配布を目的としていません。

Cursor は、スタートアップ Anysphere のサンフランシスコ拠点の AI コーディングプラットフォームで、293億ドルの評価額 を受けており、新しい社内開発モデル Composer 2 を立ち上げ、エージェント的な AI コーディング環境内で利用可能となりました。これは以前の社内モデルと比べてベンチマークを大幅に改善しています。

また、Composer 2 Fast(価格は高価だが高速なバリアント)を立ち上げ、ユーザーのデフォルト体験とします。

以下が費用の内訳です:

  • Composer 2 Standard: 100万入力/出力トークンあたり $0.50/$2.50

  • Composer 2 Fast: 100万入力/出力トークンあたり $1.50/$7.50

Cursor の前身にあたる社内モデル 2月時点の Composer 1.5 は、入力トークン100万あたり $3.50、出力トークン100万あたり $17.50 でした。Composer 2 は両方のコストで約86% 安くなっています。

Composer 2 Fast はおよそ Composer 1.5 より57%安いです。

キャッシュ読み取り価格(同じトークンを再送信する場合)の割引もあり、Composer 2 は 1,000,000 トークンあたり 0.20 ドル、Composer 2 Fast は 0.35 ドル、Composer 1.5 は 0.35 ドルです。

このリリースは Cursor ネイティブのリリースのようにも見える点が重要です。広く配布されたスタンドアロンモデルではなく、同社の発表とモデルのドキュメントでは、Composer 2 は Cursor で利用可能で、Cursor のエージェント作業フローに調整され、製品のツールスタックと統合されています。

提供された資料には、Cursor 環境外の外部モデルプラットフォーム経由での個別の提供や、一般的な用途の API としての提供を示すものはありません。

Cursor は長期的なエージェント型コーディングを提案している、単なるより良い補完機能ではなく

このリリースのより深い技術的主張は、Composer 2 が Composer 1.5 より高く評価されているだけではなく、Cursor がこのモデルは長期的なエージェント型のコーディングにより適していると述べている点だ。

同社のブログによれば、品質向上は最初の継続的な事前学習の実行から来ており、それが拡張された強化学習のためのより強い基盤を与えたとされています。そこから、長期的なコーディングタスクで訓練し、数百回のアクションを要する問題を解決できると述べています。

この枠組みは、コーディングAI における最大の未解決課題の1つに答えるものとして重要です。多くのモデルは孤立したコード生成には優れていますが、リポジトリを読み、変更点を決め、複数ファイルを編集し、コマンドを実行し、失敗を解釈して目的へと進み続ける長期的なワークフローを通して信頼性を保てるモデルははるかに少ないのです。

Cursor のドキュメントは、これが同社が重視するユースケースであることを補強しています。Composer 2 は Cursor 内でツールの使用、ファイル編集、端末操作に合わせて調整された、200,000 トークンのコンテキストウィンドウを持つエージェント型モデルとして説明されています。

また、長期実行タスクの自己要約といった訓練技術にも触れています。Cursor を主要な環境としてすでに使用している開発者にとっては、このより厳密な調整が、一般的なリーダーボードの主張よりも重要かもしれません。

ベンチマークの向上は顕著で、GPT-5.4 が1つの重要なチャートで依然トップでも

Cursor が公表した結果は、従来の Composer モデルより明確な改善を示しています。会社は Composer 2 を CursorBench で 61.3、Terminal-Bench 2.0 で 61.7、SWE-bench Multilingual で 73.7 としています。

これは Composer 1.5 が 44.2、47.9、65.9、Composer 1 が 38.0、40.0、56.9 という値と比較されます。

このリリースは、Cursor が普遍的なリーダーシップを主張していないため、他のモデルの発売より控えめです。

Terminal-Bench 2.0 は、AI エージェントがコマンドライン端末型のインターフェイスでタスクをどれだけうまくこなすかを測定します。 GPT-5.4 が依然としてトップで、75.1、Composer 2 が 61.7、Opus 4.6 が 58.0、Opus 4.5 が 52.1、Composer 1.5 が 47.9 です。

これにより Cursor の提案はより現実的で、購入者にとってより有用であると言えるでしょう。同社は Composer 2 がすべてにおいて最良のモデルだとは言っていません。モデルはより競争力の品質層へ移行し、より魅力的な経済性と、既に開発者が製品と組み合わせて使っている統合を提供していると述べています。

Cursor は CursorBench ベンチマークスイートのパフォーマンス対コストチャートも含めており、Composer 2 を Pareto 型の主張として示す設計の図のようです。

そのグラフィックでは、Composer 2 は Composer 1.5 よりコスト対性能のバランスが良く、Cursor が示す高コストの GPT-5.4 および Opus 4.6 の設定と有利に比較されます。同社のメッセージは、Composer 2 が前任より単にスコアが高いというだけでなく、Cursor 内の日常的なコーディング作業において、知能あたりのコストのトレードオフがより効率的になる可能性がある、ということです。

購入者にとって「Cursor にロックされている」点が重要な理由

Composer 2 の使用を検討する読者にとって、最も重要な質問は、ベンチマークの性能だけではなく、Cursor の独自製品体験に最適化されたモデルを求めるかどうかかもしれません。

それは強みになる可能性があります。ドキュメントによれば、Composer 2 は Cursor のエージェントツールスタックにアクセスでき、意味論的コード検索、ファイル・フォルダ検索、ファイルの読み取り、ファイルの編集、シェルコマンド、ブラウザ制御、Web アクセスなどを含みます。

この種の統合は、印象的なワンショット回答を作ることよりも、実際のソフトウェアタスクを完了することを目的とする場合には、純粋なモデル品質よりも価値があるかもしれません。

ただし、それは対象となる聴衆を狭めます。複数の外部ツールやプラットフォームにまたがって広く展開できるモデルを求めるチームは、Cursor が Composer 2 を Cursor ユーザー向けのモデルとして提示しており、一般提供のスタンドアロン型基盤モデルとしてではないことを認識すべきです。

全体像:Cursor は運用上の主張をしている

Composer 2 の重要性は、Cursor が突然すべてのコーディングベンチマークでトップに立ったということではありません。そうではありません。より重要な点は、Cursor が運用上の主張をしていることです。モデルはより良くなっており、価格はより広範な利用を促すのに十分低く、より高速な階層は反応性が高く、コストが高いにもかかわらずデフォルトにすることを同社が受け入れている、ということです。

この組み合わせは、抽象的なモデルの権威にこだわらず、長時間のコーディングセッションでも有用性を保ち、過度に高額になることを避けたいと考えるエンジニアリングチームに響く可能性があります。

Cursor の広範な 価格体系 は、このローンチをめぐる競争プレッシャーを見極めるのに役立ちます。現在の価格ページでは、無料の Hobby プラン、月額20ドルのPro プラン、月額60ドルのPro+、月額200ドルの Ultra を提供しており、上位階層ほど OpenAI、Anthropic、Google のモデルを跨ぐ利用が増えます。

ビジネス側では、Teams は1ユーザーあたり月額40ドル、Enterprise はカスタム価格で、プールされた使用、集中請求、使用分析、プライバシー管理、SSO、監査ログ、細かな管理機能を追加します。つまり Cursor は、コーディングモデルへのアクセス料金を請求しているだけではありません。複数のモデル提供者の上に位置するマネージドアプリケーション層を提供し、チーム機能、ガバナンス、ワークフローのツールを追加しています。

このモデルは、ファーストパーティの AI企業がコーディング自体へより深く踏み込むにつれて、ますます圧力を受けています。OpenAI と Anthropic は、第三者製品を通じてモデルを販売するだけでなく、Codex や Claude Code のような自社のコーディングインターフェイス、エージェント、評価フレームワークを提供しており、中間プラットフォームにどれだけ余地が残るのかという問題を提起しています。

X 上のコメント投稿者は、検証されていない場合もあり必ずしも市場全体を代表するわけではありませんが、ターミナル優先のワークフロー、長時間実行のエージェント挙動、低い見かけ上のオーバーヘッドに惹かれるパワーユーザーの間で Cursor から Anthropic の Claude Code へ移行していると説明する声が増えています。

それらの投稿の中には Cursor の価格設定、文脈の喪失、エディタ中心の体験への不満を述べるものがありつつ、Claude Code をより直接的で完全なエージェント型の作業方法として称賛しています。慎重に扱われても、そのような社会的な話題は Cursor が直面している戦略的な課題を示しています。開発者とモデル作成者のますます高機能なコーディング製品の間に位置づけるだけの価値を、同社の統合プラットフォーム、チーム管理機能を含む形で証明する必要があります。

これにより Composer 2 は Cursor にとって戦略的に重要な意味を持つ。

Composer 1.5 よりはるかに安価な社内モデルを提供し、Cursor のツールスタックに密に合わせ、より高速な版をデフォルトにすることで、外部システムのラッパー以上の価値を提供していることを示そうとしています。

課題は、ファーストパーティのコーディング製品が改善するにつれて、開発者や企業の購入者が、別個の AI コーディングプラットフォームを本当に望むのか、モデル作成者自身のツールだけで十分なのか、という点をますます問うようになるかもしれないことです。