OpenAI、「Codex」刷新 PCの直接操作に対応し汎用作業エージェントへ

ITmedia AI+ / 2026/4/17

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageIndustry & Market Moves

要点

  • OpenAIがコーディングエージェント「Codex」を大幅更新し、コード生成支援から一歩進んでPCの直接操作を含む「汎用作業エージェント」として機能強化した。
  • 画面認識に基づきカーソル操作や入力を行う「computer use」機能を導入し、さらに複数エージェントの並列稼働でバックグラウンド実行も可能にしている。
  • Web内ブラウザやJIRA/GitLab/Microsoft製品群など90以上のプラグインを追加し、開発管理〜CI/CD〜データ基盤まで開発ワークフロー横断の作業を狙う。
  • gpt-image-1.5との統合でコードと画像を同一環境で扱えるほか、メモリ(設定・操作履歴)や継続/反復タスク自動化で長期的な実行にも対応する。
  • GitHubレビューコメント対応、複数ターミナル同時利用、SSH経由のリモート開発環境接続(α版)など開発者向け機能も拡充し、Mac/Windowsデスクトップアプリで順次提供を開始した。

 米OpenAIは4月16日(現地時間)、コーディングエージェント「Codex」の大幅アップデートを発表した。今回の更新では、従来のコード生成支援にとどまらず、PC操作や外部ツール連携などを含めた「汎用作業エージェント」としての機能強化が図られている。

 codex 1 (画像:OpenAI)

 最も大きな変更点は、ユーザーのPC上のアプリを直接操作できる「computer use」機能の導入だ。Codexは画面を認識し、自らカーソル操作や入力を行い、アプリの起動や操作を実行できるようになった。さらに複数のエージェントを並列で動作させることも可能で、ユーザーの作業を妨げずにバックグラウンドでタスクを進められる。これにより、APIが用意されていないアプリやフロントエンドのテスト作業などにも対応できるようになる。

 codex 2 MacOS上でCodexを操作(画像:OpenAIの動画より)

 Webや各種ツールとの連携も大幅に強化された。アプリ内ブラウザを備え、Webページ上に直接コメントして指示を与えられるほか、JIRAやGitLab、Microsoftの製品群などと連携する90以上のプラグインが追加された。これにより、開発管理やCI/CD、データ基盤など、開発ワークフロー全体を横断した作業が可能になる。

 生成機能も拡張された。画像生成モデル「gpt-image-1.5」との統合により、コードと画像を組み合わせたUI設計やモックアップ作成が同一環境で行えるようになった。また、ユーザーの操作履歴や設定を記憶するメモリ機能や、継続的・反復的な作業を自動化する機能も追加され、より長期的なタスク実行に対応する。

 加えて、開発者向け機能として、GitHubのレビューコメントへの対応、複数ターミナルの同時利用、SSH経由でのリモート開発環境接続(α版)などが導入された。ファイルのプレビュー表示や、エージェントの計画や進行状況を可視化するサマリーパネルも備え、開発プロセス全体の効率化を支援する。

 これらのアップデートは同日から、ChatGPTアカウントでログインしたCodexのデスクトップアプリ(MacおよびWindows)ユーザー向けに順次提供される。PC操作機能は当初macOSでのみ利用可能で、今後EUや英国などにも展開予定。メモリなどのパーソナライズ機能はEnterprise、Eduユーザー、欧州・英国ユーザー向けに順次提供される見込みだ。

関連記事

関連リンク

Copyright © ITmedia, Inc. All Rights Reserved.

続きを読むには、コメントの利用規約に同意し「アイティメディアID」および「ITmedia AI+メールマガジン」の登録が必要です