私たちはMCPを発明した――コマンドラインを再発見するために

Dev.to / 2026/3/29

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisTools & Practical Usage

共有:

要点

この記事は、MCPが通常の「AIの流行→導入」のサイクルを1年未満で駆け抜け、急速なIDE統合と大規模なエコシステムの成長を実現した一方で、本番環境の現実に直面して失速したと主張している。
トークン消費が根本的なボトルネックであると述べている。すなわち、LLMに大きなツールのスキーマを公開するだけで、ユーザーのプロンプトが処理される前に、モデルのコンテキストウィンドウのほぼ全量を消費し得るという。
MCPは認可と同意のフローを実装者に委ねてしまうため、企業向けのセキュリティは十分に解決されていないと論じている。その結果、チームが自前で認証を作り直す必要が生じ、既存のコンプライアンス要件との整合性が取りづらくなる。
報告されているセキュリティ調査におけるリスクも取り上げている。たとえば、MCPの脆弱性がどのようにリモートコード実行につながり、Azureテナントの乗っ取りを可能にし得るかを示すデモがある。
この記事は、トークン経済性やセキュリティの問題にとどまらず、エージェントシステムの基盤となるプリミティブとしては「ツール呼び出し」が不適切かもしれないという結論を示している。つまり、MCPの設計は、より長期の本番ニーズに対して十分に対応できていないことを示唆している。

AI時代では、時間の流れが異なります。今は、1年でおよそ半世紀分…ではなく、標準的な技術サイクルの約5年分が詰まっています。

私たちは以前、ソフトウェアのパターンが、そのライフサイクル全体をスローモーションで走り切るのを眺めていました。jQuery、Angular、あるいはNext.jsのPages Routerを思い浮かべてください。どれも完走までにだいたい5年かかりました。山のような熱狂がピークに達し、現実の現場での導入がぐちゃぐちゃになり、技術的負債とのスローモーション衝突が起き、そして最後に、本当に機能するものへ静かに引き戻される――そんな流れです。

MCP（Model Context Protocol）は、その“スピードラン全行程”を12か月未満で一気にやってのけました。

2024年末にAnthropicがこれを公開すると、LinkedIn界隈はすぐに「AIにおけるUSB-C」だと持ち上げました。2025年半ばには、主要なすべてのIDEが統合し、エコシステムは月間のSDKダウンロード数がほぼ1億件に到達、開発者は午後のうちにデモ用サーバーを出荷し、エージェント統合の問題は解決したのだと、気持ちよく宣言していました。

ところが、皆が実際に本番環境で動かそうとすると――

熱狂が冷めると、土台には巨大な亀裂が3つ一気に現れました。

トークン計算が残酷

LLMに公開するあらゆるツールはトークンを食います。少しではありません。かなりです。

Cloudflareは最近、この計算をやってみせました。標準的なMCPサーバー経由で自社APIの2,500のエンドポイントを公開するには、スキーマ定義だけで1.17百万トークンを消費してしまうとのことです。これは、今日の最先端モデルの文脈ウィンドウ全体よりも多い。ユーザーがプロンプトを入力する前に、完全に破壊されます。

Cloudflareでなくても、壁にぶつかることはありません。Apideckは実例の導入を記録しています。MCPサーバーは3つだけ（GitHub、Slack、Sentry）使うだけで、約40個のツールがロードされました。すると200,000トークンのウィンドウから143,000トークンを使ってしまう。これはモデルの稼働メモリの72%が消えるということです。

皮肉なのは、それが構造的だという点です。あなたのエージェントをより高能力にしたいほど――つまりツールを増やしたほど――愚かになります。なぜならツールのスキーマが文字通り、モデルの推論能力を押しのけるからです。

認証はエンタープライズに生き残れない

MCPの仕様は、同意と認可のフローを実装者に委ねることを公然と明記しています。実際には、これはつまり、すべての開発チームが現在、認証をゼロから作り直しているということです。たいていは下手に、そしてたいてい締め切りの下で。

本番の現実は厳しい。REST APIの上に構築する企業は、すでに10年以上前に、レート制限、改ざん耐性の監査ログ、ロールベースのアクセス制御を解決していました。MCPはそれらの教訓を捨て去り、ローカルのデモで“ツール呼び出し”が優雅に見えるようにすることを優先したのです。

その結果、MCPはSOC 2、PCI DSS、FedRAMPに関する認証を一つも持っていません。OAuthの仕様は、現代のエンタープライズの実務と衝突します。つい最近開催されたRSA Conferenceで、研究者たちはMCPの脆弱性がリモートコード実行を可能にし、Azureテナントを丸ごと乗っ取るまで到達し得ることを示しました。これは監査担当者にとって最悪の悪夢です。

ツール呼び出しはそもそも間違ったプリミティブ

これは最も深い亀裂で、産業がようやく認めるまでに最も時間がかかったものです。

LLMには、現実世界のTypeScriptやPythonがトレーニングデータとして大量に入っています。ところが、ネイティブMCPツールの“独自メニュー”を手探りでナビゲートすることについての学習データはほとんどありません。ここから読み取れる含意は、後から考えると明らかです。LLMは本質的に、コードを書くことのほうがボタンをクリックすることより得意なのです。

Cloudflareはこれを実証しました。直接のツール呼び出しを行うエージェントと、「Code Mode」を使うエージェントを比較し、31件のカレンダーイベントを作成させたのです。ツール呼び出しのエージェントは、30回以上の個別の逐次呼び出しを発火させ、毎回モデルに文脈を作り直す（再処理させる）ことを強いました。Code Modeのエージェントは、単純なループを書いて、1回の実行の中で日付をなぞるだけでした。

クラウドフレアは、2,500のエンドポイントを従来のMCPのやり方から、モデルがコードとして書き当てる“型付きSDK”へ変換しました。するとトークン使用量は81%減少しました。

ツール呼び出しのパラダイムは、LLMを“頭の悪いオーケストレーター”として扱います。コード生成は、それが実際に何者なのか――つまり非常に優秀なプログラマー――として扱います。

12か月での反転

ここ数週間で、公開の場での“現実直視”がついに到来しました。

2週間ほど前のAsk 2026カンファレンスで、PerplexityのCTOであるDenis Yaratsが、「当社は内部ではMCPをやめ、従来のAPIとCLIに切り替える」と発表しました。文脈ウィンドウの消費量と、認証の不格好さを理由に挙げています。おまけのように決定的だったのは？ Perplexityは4か月前に、自社のMCPサーバーをすでに出荷していたのです。作って、本番で動かして、嫌になって、たった1四半期のうちに方針転換した――そういう流れでした。

Y Combinatorの代表であるGarry TanはXで率直にこう言いました： 「MCPは正直ひどい……飽きて、代わりにCLIラッパーを“雰囲気で”作った」 と。信頼性と速度を理由に挙げています。Hacker Newsのほうでは、mcp2cliというツール――文字通りMCPツールをただのCLIコマンドへ変換するもの――がトップページに載り、99%のトークン削減をうたっていました。

一方でCloudflareは、公式にCode Modeを“直接の回答”として出荷しました。数千ものツールを公開するのではなく、モデルが型付きAPIに対してコードを書きます。ツールは2つ。1,000トークン未満。CloudflareのAPI全体が、すぐに利用可能です。

振り子が元に戻る

もしWeb開発に十分長くいれば、ジョークがわかるはずです。私たちは、サーバーサイドで描画するページから、複雑なクライアント描画のSPAへ行き、そのままサーバー描画に逆戻りした――つまりそういうことです。10年がかりで綺麗に一周して、その間に産業は何百万時間もを費やしました。

私たちは、AIツールがまったく同じループを、わずか1年でやり切るのを見てしまいました。

私たちは基礎的なAPIから、非常に洗練されたツール呼び出しプロトコルへと慌てて飛びついたのに、その限界にぶつかって、結局は30年前のアイデアに着地してしまいました：コマンドライン、RESTエンドポイント、型付きSDK。Julien Simonは、まさにこれらの問題を2025年半ばに公に指摘していました――セッションモデルが横方向にスケールしないこと、認証が後回しになっていること、JSONのオーバーヘッドなどです。そして“反対派”として、怒ったメッセージをもらう結果になりました。8か月後、PerplexityのCTOがステージに立ち、まったく同じことを言いました。

これが、AI後の時代に実際に“構築する”ときの姿です。振り子はまだ揺れます。ただし、猛烈な速さで揺れます。かつて5年かけて回っていた熱狂サイクルが、今は1つのプロダクトサイクルで完結します。学ぶべき教訓は同じで、授業料が徴収されるだけが速くなった、というわけです。

いまエージェントを作っているなら、問いは「一番新しいプロトコルを自分のスタックにどうねじ込むか」ではありません。問いはこうです：私の課題を本当に解決する、これ以上ないほど単純なプリミティブは何か？

9回に1回は、誰かが何十年も前にそれをすでに発明しています。

型付きSDK。RESTエンドポイント。APIキー。CLI。そして、その上に構築するフレームワークは価値がありますが、フレームワークが土台と戦い始めた瞬間、土台の勝ちになります。

それを最も早く理解し、洗練された新しい抽象化が“本当にその席を得る”まで呼び水のような誘惑に抵抗できるチームこそが、本番環境で実際に機能するエージェントを出荷できるでしょう。その他のチームは、このサイクルがこれまで以上に速く繰り返される間に、今後12か月をコンテキストオーバーフローのエラーやOAuthフローのデバッグに費やすことになります。