OpenAI Codexが「コンピュータ操作」「画像生成」、さらに90以上のプラグイン対応に。誰も言わない3つのポイント

Dev.to / 2026/4/18

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageIndustry & Market MovesModels & Research

要点

  • OpenAIは4月16日に、Codexデスクトップを大幅にアップデートし、Macでの「コンピュータ操作」(バックグラウンドでのエージェント動作)やGPT-Image-1.5、インアプリのブラウザ、メモリ、90+の新プラグインを一度に追加するなど、アプリの仕組み自体を刷新しました。
  • 重要な差は、Codexのコンピュータ操作がユーザーの作業を止めて奪うのではなく「並行して」動く点で、マウス操作を丸ごと渡す方式よりも邪魔になりにくく、ロボット支援というより「同僚のような」体験を狙っています。Macは地域のコンプライアンス完了後の提供で、Windowsは「近日中」です。
  • GPT-Image-1.5は“きれいな画像を作るため”というより、コーディングの流れの中でデザインから実装までのループを短縮するための機能として位置づけられており、複数アプリやウィンドウを行き来せずに修正まで進められるのが焦点です。
  • 90以上のプラグイン投入は、単なる機能追加というよりMCP(Model Context Protocol)へ向けた布石(トロイの木馬)になり得ると示唆されます。
  • 開発者の利用も急増しており、週次の開発者数が1月の1.2Mから現在3Mに増えた(3か月で約150%成長)とされ、企業向けのコーディング・エージェント利用での勢いを裏づけています。

もともと news.skila.ai に掲載

OpenAIは4月16日、サービス開始以来最大規模となるCodexのデスクトップアップデートを出荷しました。バージョン番号の更新ではありません。アプリが行うことの全面的な書き換えです。

Macでのコンピューター操作。コーディングの流れの中にGPT-Image-1.5。コメントを直接反映できるアプリ内ブラウザ。メモリ。そして1リリースで90以上の新しいプラグインを投入。

週次の開発者数は、1月の1.2Mから現在3Mへ跳ね上がりました。これは、すでにエンタープライズ向けのコーディングエージェント会話を独占していたプロダクトから、3か月で150%の成長です。

誰もが機能リストを取り上げています。ですが、もっとも重要なのは、誰も指摘していない3つの点です。

第1の点: コンピューター操作は「乗っ取り」ではなく「バックグラウンド」

見出しを読むと、CodexがあなたのMacを勝手に奪ったのだと思ってしまうでしょう。実際は違います。

コンピューター操作モードは、あなたのそばで動きます。あなたの代わりではありません。OpenAI自身の4月16日の発表文の言い回しでは、Codexは「当該アプリケーションで指示された通りのアクションを実行でき、さらにMacユーザーの場合は、あなたがエージェントのためにバックグラウンドで作業を続けている間も、あなたがコンピューターを手動で使い続けることができる」そうです。

この一文が重要です。Anthropicのコンピューター操作は2024年10月に提供されましたが、マウスを手渡す必要があります。カーソルが勝手に動くのを見るのは、違和感があり、実務には使い物になりません。あなたはコーヒーを入れに行きます。

OpenAIはモデルをひっくり返しました。Codexは、Jiraのチケット更新やSlackスレッドの掘り起こし、スクリーンショットへの注釈などを、サンドボックスの層の中で実行するようになりました。一方で、あなたのキーボードはCursorまたはVS Codeのままです。質問するためにコーディングを止める必要がありません。

実務面でのインパクトは、Codexが「ロボットのアシスタント」ではなく「同僚」に感じられる、最初のメインストリームのエージェントになったことです。

提供状況: まずMac。EUとUKのユーザーは、OpenAIが地域ごとのコンプライアンス確認を終えるまで締め出されています。Windows対応は「近日」で、日時は未定です。

第2の点: GPT-Image-1.5は「きれいな画像」ではない。「デザインのループを閉じる」ためのものだ

GPT-Image-1.5に関する報道の焦点は生成品質です。ポイントを外しています。

本当の変化はワークフローの圧縮です。このアップデート以前は、フロントエンドのタスクがこう見えていました。スクリーンショットを撮る→Figmaを開く→モックアップを下書き→書き出す→チャットに貼り付ける→Codexに実装を依頼する。ウィンドウが5つ、アプリが3つ、コピペが2回。

今はこうです。バグをスクリーンショットで取り込む→Codexに「同じ寸法で3つのリデザイン案を出して、いちばん気に入ったものを選んでJSXを修正して」と伝える。会話は1つ、状況の切り替えはなし。

実在感のあるアイコン表現や、正確なブランドカラーはまだ弱点です。Stable Diffusionの直近世代の派生は、まっさらの2Dアートでは依然としてそれを上回ります。ですが「このカードを10%背を高くして、アクセントカラーを差し替えて」というような用途では勝ちます。エディタから一度も離れないからです。

第3の点: 90のプラグインはMCPのためのトロイの木馬

OpenAIはこれを「90+の追加プラグイン」と呼びました。よく見てください。リリース一式は、3つのカテゴリが1つの数字にまとめられています。skills、アプリ連携、そしてMCPサーバーです。

主要なAIベンダーがMCPサーバーを、第一級のインストール体験として出荷するのは初めてです。連携をクリックする。登録される。終わり。npmインストールも、JSONの編集も、stdioの配線も不要。

連携一覧は、エンタープライズの要望リストのように読めます。JiraとConfluence向けのAtlassian Rovo、CI/CD向けのCircleCIとGitLab Issues、TeamsとOffice向けのMicrosoft。

Model Context Protocol(MCP)上で開発している人にとって、これは仕様がこれまで持ってこなかったレベルでの裏取り(バリデーション)です。GitHubの公式MCPサーバーは、その同じ週にStreamable HTTPを追加しました。スタックが急速に一本化してきています。

発表の中に埋もれている、眠れる機能があります。アプリ内ブラウザが、ウェブページのコメントをエージェントの指示として扱うようになったのです。ボタンをハイライトして、「このフォームの入力が無効のときは無効にされるべき」と入力すれば、Codexはそれをタスクとして読み取ります。これは他のエージェント系ツールが今後6か月以内にコピーするであろうUXの基礎要素です。

メモリ機能が実際にやっていること

主要3つの機能と一緒に出荷されたのは、メモリのプレビューです。ChatGPTのような雑学の想起ではありません。これは「行動」を学習するモデルです。

Codexは、あなたの修正内容を覚えるようになりました。「私はスペースよりタブが好き」と一度伝えるだけで、その後は聞かなくなります。importのソートスタイルを2回ほど直してやると、それ以降のあらゆるファイルに対して、そのパターンを内部化します。

注意点があります。現時点ではメモリはEnterprise、Education、EU、UKのユーザーでは利用できません。加えて、ChatGPTのメモリと異なり、まだプロジェクト単位の分離もありません。

これが実際に倒すのは誰か

Cursorではありません。Cursorは「AIつきのIDE」というカテゴリを押さえており、このアップデートはそこに侵入していません。

本当の犠牲者は、ミドルレイヤーです。端末とチケットシステムの間に座ろうとしていたスタンドアロンのエージェントアプリが、これにより立場を失います。「デスクトップ上の自律型エンジニア」として売り込んでいたツールは、CodexがChatGPTのサブスクリプションに無料で付いてくるのに、なぜそれらを使うのかを説明しなければならなくなります。

週次の開発者数3M

OpenAIは、週次で3Mの開発者がCodexを利用していることを確認しました。これは、世界のプロの開発者人口のざっと10%に相当します。GitHub Copilotは、直近のアップデートで有料シートが約10Mだと報告しています。Codexは、その規模感の「無料枠版」で、ChatGPT PlusおよびProのアカウントで動作します。

採用への示唆はこうです。「Codexに詳しい」が、AI志向のエンジニアリング職における最低条件(テーブルステークス)になりました。採用要件に7月までに入ってくるはずです。

よくある質問

OpenAIのCodexデスクトップアプリとは何ですか?
Codexは、ChatGPT PlusおよびProの加入者向けに提供される、OpenAIのデスクトップ向けコーディングエージェントです。macOSとWindowsで利用でき、AIエージェントとしてコードの作成、コードベースの閲覧、シェルコマンドの実行が可能です。そして2026年4月16日以降、他のMacアプリの操作、画像の生成、さらに90以上のプラグインの利用もできます。

Codexのコンピューター操作は、Anthropicのコンピューター操作とどう違いますか?
Anthropicのバージョンはマウスとキーボードを乗っ取るため、動作中は作業できません。Codexは、あなたが自分のマシンを使い続けている間に、コンピューターのアクションをバックグラウンドで実行します。

2026年4月にOpenAI Codexはいくらかかりますか?
CodexはChatGPT Plus($20/月)とChatGPT Pro($200/月)に含まれます。90以上のプラグインとコンピューター操作モードは追加料金なしで含まれます。

2026年にOpenAI Codexの最適な代替手段は何ですか?
最も近いIDEネイティブの代替はCursorです。エージェント型のコーディングなら、Claude CodeとGitHub Copilot Workspaceが異なる領域をカバーします。ビジュアルなアプリ構築なら、Lovable 2.0がプロンプトからフルスタック生成を扱います。

返却形式: {"translated": "翻訳されたHTML"}