OpenAI、Codexデスクトップアプリを大幅に更新—PC内の他のアプリをすべて利用し、画像生成やウェブページのプレビューも可能に

VentureBeat / 2026/4/17

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageIndustry & Market Moves

要点

  • OpenAIは、MacおよびWindows向けのCodexデスクトップアプリを更新し、アシスタントが他のインストール済みアプリにアクセスして、ユーザーの依頼に基づきそれらの中で関連情報を提示し、アクションを実行できるようにします。
  • このアップデートにより、Codexは「Computer Use」によって機能が拡張され、Macユーザーはコンピュータを使い続けながら、エージェントにバックグラウンドで作業させられるようになります。
  • OpenAIはCodexに組み込みのWebブラウザを追加し、gpt-image-1.5に紐づく画像生成ワークフローを統合することで、Webサイト、プレゼンテーション、さらにはゲームのアセットなどのためのビジュアル制作を可能にします。
  • OpenAIは、Codexを「より強力な“エージェント”の基盤」と位置づけ、従来のテキスト中心のコーディング支援を超える「スーパーアプリ」体験を目指しています。
  • このリリースは、AnthropicのClaudeデスクトップ体験など競合の取り組みを踏まえたうえで、macOSにおけるバックグラウンドでのカーソル/ワークフローを同時に扱える点などの違いを強調しています。

週あたり300万人の開発者に到達したことを確認する中で、OpenAIは、今日、MacおよびWindowsのデスクトップアプリを通じてCodex開発者環境を大幅に更新し、同社が追求している「スーパーアプリ」にさらに近づけます。

今日まで、Codexは主に、ユーザーの指示に従ってソフトウェアを記述、編集、デバッグし、リリースするために、OpenAIの基盤となる言語モデルを使うための環境でした。

これによりCodexは、あなたのコンピューター上の他のすべてのアプリにアクセスできるようになり、求められたときはもちろん、必要に応じて事前に関連情報をあなたに提示し、当該アプリ内で指示されたとおりのアクションを実行できるようになります。そしてMacユーザーの場合は、バックグラウンドで動くエージェントに並行して、あなたがコンピューターを手作業で使い続けている間でも、それを行えるようになります。

CodexチームのOpenAI技術担当であるAndrew Ambrosinoは、私が昨日オンラインで参加した報道向けブリーフィング(報道内容には一定の制約がある席)で、この変更を率直に説明しました。「Codexは実際にアプリをクリックでき、アプリを起動でき、アプリに文字を入力できます。これはあなたのマシン上のどんなアプリでも動作します。」

デスクトップ版のCodexにはさらに、内蔵のWebブラウザが追加され、フロントエンド開発をユーザーがプレビューできるようになり、またOpenAIの強力なAI画像生成モデルgpt-image-1.5と直接統合されたパイプラインによって、プロジェクト向けの画像を生成できるようになります。Webサイトからプレゼンテーション、さらに何百ものアセットを備えたフルのプレイ可能なPCゲームまで、同じスタイルで一括して生成できます。

ブリーフィングで、OpenAIのCodex責任者であるThibault "Tibo" Sottiauxは次のように述べました。「成長の話だけではありません。非常に能力の高いエージェントを、ビルダーの手に渡すことです。しかも今、私たちはそれを、あなたのコンピューター全体にわたって、これまで以上に多くの作業をまるごと拡張して実行できるようになっているのを見ています」

OpenAIが、より広く知られた旗艦アプリであるChatGPTではなく、Codexの中でなぜこれらすべてを追求しているのかと問われると、SottiauxはVentureBeatに対してこう答えました。「Codexは私たちの最も強力なエージェントです。すでにあなたのコンピューター上で動いていました。だからこそ、そこに能力を拡張することになります。自然な流れだと思いました。いずれきちんと筋の通った形にしていきます。」

この更新は、競合のAnthropicがこれまでに、Claude Coworkの立ち上げや、Claude Codeデスクトップアプリのビューを刷新したことで、同様のユースケースを打診してきたタイミングとも重なります。これらはMacおよびWindows向けのClaudeデスクトップアプリ内で利用可能です。しかしClaudeは、Codexのように、デスクトップアプリからユーザーの全アプリに対して同時にバックグラウンドでカーソル操作を行うことはできません。

macOSにおけるバックグラウンドでの複数エージェント型コンピューター利用ワークフロー

今回のリリースで最も大きな技術的飛躍は、「Computer Use(コンピューター利用)」で、現時点ではmacOSユーザーに限定されています。

この機能により、Codexは従来のチャットボットの入れ物から抜け出し、あるマシン上のあらゆるアプリに対して「見る、クリックする、入力する」ことが可能になります。

決定的なのは、これがバックグラウンドで行われる点です。「デスクトップ全体を乗っ取るのではなく、バックグラウンドであなたのコンピューター上のアプリを使えるんです」と、OpenAIの開発者向けプロダクトコミュニケーション担当であるCaffrey Lynchは説明しました。

これにより「マルチエージェント」型のワークフローが実現します。たとえばCodexがフロントエンドの変更をテストしたり、JIRAチケットのトリアージを行ったりしている間、開発者は別のアプリで作業を続けられます。

Windowsユーザー向けには、コアとなるCodexデスクトップアプリは引き続き利用可能でサポートされています。また、それらのアプリから情報を取得してCodex内でユーザーに提示することも可能ですが、起動時点でMacにあるカーソル単位のバックグラウンド対話はありません。

エンドツーエンドのソフトウェア開発のためのワンストップショップ

OSの操作にとどまらず、OpenAIは「ソフトウェア開発ライフサイクル」(SDLC)にさらに力を入れています。Codexアプリは今や、統合されたワークスペースのように機能し、GitHubのPRレビューからリモート基盤の管理まで、あらゆることを支援します。

「このリリースを最も単純に捉える方法は、Codexとアプリが、より広い範囲にまたがって作業できるように“教える”ことです」と、Codexアプリ開発のリードであるAndrew Ambrosinoは述べました。この“範囲”には、現在次が含まれます。

  • 統合ブラウザ: アプリ内ブラウザにより、DOM要素に直接コメントを付けることでフロントエンド設計を反復できます。これにより、エージェントが従うべき指示を正確に与えられます。

  • ビジュアルプリミティブ: gpt-image-1.5を統合したことで、Codexは開発ワークフローの中で、モックアップやゲームアセット用の画像を生成し、反復して改善できるようになりました。

  • 拡張されたサイドバー: アプリには、PDF、スプレッドシート、スライドデッキといったコード以外のファイルのリッチなプレビューが追加され、さらにエージェントの計画とソースを追跡するためのサマリーペインも備わっています。

  • ターミナル & SSH: 今回の更新では、複数のターミナルタブをサポートし、SSH経由でリモートの開発環境(devbox)に接続するためのアルファ機能も追加されます。

これらのバラバラの作業をつなぐために、OpenAIは90以上の新しいプラグインを提供します。CircleCI、GitLab、Microsoft Suiteなどのコネクタにより、エージェントは、開発者が日々利用するツールチェーン全体にわたってコンテキストを集め、アクションを起こせるようになります。

ブリーフィング中に披露されたデモ動画では、OpenAIはユーザーがCodexのプロンプト入力欄に「Slack、Gmail、Googleカレンダー、Notionを確認して、私の注意が必要なものは何か教えてくれる?」と入力する例を提示しました。これは、Codexが複数のアプリを横断してそれらすべてから情報を収集し、単一のプロンプトで重要なものをユーザーに提示できることを示しています。

「Codexに特定のアプリを使わせたいなら @ で言及できますし、そうでなければCodexが、どのアプリを使うべきかを見つけられます」とAmbrosinoは述べました。

生産性の「心拍」

より微妙だが強力な変化の一つが、永続的なエージェンシー(主体性)の導入です。「Heartbeat Automations(ハートビート・オートメーション)」によって、Codexは自分自身の将来の作業をスケジュールでき、長期タスクを継続するために「目を覚ます」ことができます。

これによりチームは、SlackチャンネルやNotionドキュメントを監視するエージェントをセットアップし、ドキュメントやランディングPRを事前に更新することができます。

これは新しい「Memory(メモリ)」機能によって支えられており、現在プレビュー段階です。MemoryによりCodexは、個人的な好み、これまでの修正、収集した情報を覚えられるようになり、毎回の新しいセッションで膨大なカスタム指示をする必要が減ります。

「Codexを使っていくほど、Codexは事前に動く能力も高まっていきます」とSottiauxは指摘しました。

こうした事前性は、「daily brief(デイリーブリーフ)」というスタイルの機能として表れます。アプリが、未解決のGoogleドキュメントのコメントや関連するSlackの状況を特定することで、1日の始め方を提案します。

これは、今週初めにAnthropicがClaude Code製品向けにリリースした新しい「Routines(ルーティン)」機能と、精神面でも実践面でも似ています。

ライセンシング、料金、提供状況

OpenAIは最近、チーム向けに、より柔軟な価格モデルへと移行しています。これには、月額100ドルのプランや、拡大する自律エージェントの利用に対応する従量課金の選択肢が含まれます。個人ユーザー向けには、今回のアップデートは今日から、ChatGPTでCodexデスクトップアプリにログインしている人へ順次提供されます。

CodexデスクトップアプリはmacOSとWindowsの両方で利用可能ですが、特定機能の提供は段階的です。

  • バックグラウンドでのコンピューター利用: 提供開始時点ではmacOSのみ。

  • パーソナライズ(メモリ/提案): Enterprise、Edu、EU、英国ユーザー向けに近日提供予定。

  • コアとなるソフトウェア開発ライフサイクルの更新: 今日からすべてのデスクトップアプリユーザーに利用可能。

ビジョン:開発者ツールから、誰もが使えるSuper Appへ

これらの機能がAIの「Super App」の基盤を表しているのかと聞かれた際、ソトリアウは戦略を次のように確認しました。「私たちはSuper Appをオープンな形で構築し、Codexアプリから発展させていきます」。

その目的は、開発者がコードを書く時間の大半ではなく、調整や状況(コンテキスト)の収集に多くの時間を費やしているという現実に対処することです。

Codexを、オペレーティングシステムや、より広範な開発者向けツールのエコシステムに近づけることで、OpenAIはそれを現代のソフトウェア開発の中枢神経として位置付けています。

同社は公式発表で、「私たちの使命は、AGIが人類すべてに利益をもたらすことを確実にすることです」と述べました。「それは、人々が想像できることと、人々が実際に構築できることのギャップを縮めることを意味します」。