サム・アルトマンはオフィスチェアに脚をもぐり込ませるようにして座り、天井をじっと見つめている。とはいえ、サンフランシスコのミッション・ベイにある新しい OpenAI 本社——ガラスとブロンド色の木でできた、まるでお寺のような建物——は、こうした瞑想を促しているように見える。受付の後ろには、街灯のように「AIの時代(Eras of AI)」を説明する小冊子が置かれていて、それはまるで悟りへの道のりの段階のようだ。階段沿いには、Dota 2で上位ランクのeスポーツチームを、機械が打ち負かしたときのように、AIの節目となる勝利を示すポスターが貼られている。数千人の人間がライブ配信で見守ったあの出来事だ。廊下では、研究者たちが神聖な“ブランド物”の服を着て通り過ぎていく。あるTシャツには「良い研究には時間がかかる」と書かれている。理想を言えば、時間をかけすぎない程度に。
アルトマンと私は、巨大な会議室にいる。私が彼に投げかけた問いは、AIによるコーディング革命——そしてなぜOpenAIがそれを主導しているように見えないのか——ということだ。何百万ものソフトウェアエンジニアが、自分のプログラミング作業をAIに委任し始めており、これによりシリコンバレーの多くの人々は、初めて自分の仕事の自動化と向き合うことを迫られている。コーディング・エージェントは、企業がAIに対して大金を払ってもよいと考える数少ない分野のひとつとして浮上してきた。この瞬間は、そしておそらくそうあるべきだが、OpenAIの階段沿いの次の“勝利のポスター”になり得る。だが、今のところ大きく刷り込まれている名前は、別の誰かのものだ。
OpenAIの離反者たちによって始まった、より小規模なライバルのAnthropicは、プログラミング・エージェントで爆発的な成功を収めている。Claude Codeだ。この製品は同社の売上のほぼ5分の1を占める——同社によれば、年換算の収益は25億ドル超(2月時点)。1月末までに、OpenAI版のCodexは年換算でちょうど10億ドルをわずかに超える程度の売上をもたらしていたという。これは、その件を直接知る人物によるものだ。いったい何が違うのか?
「まず市場に出た者が大きな価値を得る」とアルトマンは、ようやくそう言う。「それはChatGPTでもそうだった」。だが彼は、OpenAIがコーディングに踏み込むには今がちょうどいい時期だと言う。同社のAIモデルは、非常に有能なコーディング・エージェントを動かすのに十分な出来になっていると彼は考えている。(もちろん同社は、それが可能になるように何十億ドルもかけて学習させた。)「これはものすごく大きなビジネスになる。経済的価値だけを見てもそうだし、コーディングが解き放つ汎用的な仕事の面でもそうなる」とアルトマンは言う。「軽々しく言っているわけではないが、これは“数兆ドル規模の”まれに見る市場のひとつだと思う」。さらに彼は、Codexは「おそらく、汎用人工知能を作るうえで最もあり得る道筋」だとも言う。OpenAIの定義によれば、それは、ほとんどの経済的に価値の高い仕事において人間を上回れるAIシステムのことだ。

サム・アルトマン(OpenAIの最高経営責任者)。
写真: MARK JAYSON QUINESアルトマンがプレッツェルのポーズによる落ち着いた雰囲気の中から自信に満ちた発言をしてみせる一方で、過去数年の同社の実情は、ずっとごたごたしていた。内部の話を聞くために、私は30人以上の関係者に取材した。そこには、現在のOpenAIのリーダーや、同社の承認を得て参加した従業員も含まれている。また、民間企業の内側の仕組みについて語るため、匿名を条件に話してくれた人たちもいた。彼らの証言が描くのは、OpenAIがこれまでにほとんどなかった立場——つまり、追いつくために走っている状態だ。
2021年にさかのぼると、アルトマンやほかのOpenAIのリーダーたちは、サンフランシスコのミッション地区にある同社の当時のオリジナルオフィスにWIREDの記者スティーブン・レビーを招き、ある新しいものを見せた。それはOpenAIのGPT-3モデルの派生で、GitHubから公開されたオープンソースコードの何十億行にも及ぶデータで学習していた。デモでは、幹部らがツールのCodexが、英語の指示を入力として受け取り、シンプルなコード断片を出力できることを示した。
「実際に、あなたの代わりにコンピューターの世界で動けます」と当時、OpenAIの社長兼共同創業者のグレッグ・ブロックマンは言った。「命令を実行できるシステムがあるんです。」それでも当時、OpenAIの研究者たちはCodexが「スーパー・アシスタント」を開発するうえで鍵になるのは明らかだと考えていた。
この時期、アルトマンとブロックマンの生活は、OpenAI最大の投資家であるMicrosoftとの会合を中心に回っていた。ソフトウェア大手はCodexを、最初期の商用AIプロダクトの1つである、GitHub Copilotというコード補完ツールに組み込もうとしていた。GitHub Copilotは、プログラマーが普段使っている環境の中で動く。Codexは「この段階ではオートコンプリート以上のことはあまりできなかった」と、初期のOpenAI従業員が私に語ったが、Microsoftの幹部はそれをAIの未来を示すサインとして持ち上げた。GitHub Copilotが2022年6月に一般公開されると、数カ月のうちに利用者は数十万人規模にまで膨れ上がった。

OpenAIの社長グレッグ・ブロックマン。
写真:MARK JAYSON QUINESOpenAIの最初のCodexチームは、ほかのプロジェクトへと移っていった。同社は、コーディング能力を今後のモデルに組み込む計画を立てていたと従業員は言っており、別個の取り組みをする必要はないと考えていたようだ。一部のエンジニアは、同社の画像生成器DALL-E 2に配置転換された。ほかの人たちはGPT-4の学習へ回ったが、これこそがOpenAIをAGIにより近づける最善の道だと見なされていた。
そして2022年11月にChatGPTが登場し、2カ月のうちに1億人超のユーザーを獲得した。他のあらゆるプロジェクトは、すべて足を止めた。それから何年も、OpenAIにはAIのコーディング製品に取り組む専任チームがいなかったという。Codexチームの元メンバーの一人が言うには、それは会社が新たに掲げた消費者向けへの注力の外側にあるように見えた。さらに同氏は「部門全体がGitHub Copilotで“カバーされている”ように感じた」と続けた。OpenAIは、そのツールを動かすための新しいモデルを提供することはできる。しかしそれはMicrosoftの縄張りだった。
OpenAIは2023年と2024年の大半を、代わりにマルチモーダルAIモデルとエージェントへの投資に費やした。これらは、テキスト、画像、動画、音声を理解し、まるで人間のようにカーソルやキーボードを操作するために設計されている。この取り組みは、AI業界がどこへ向かっていたのかにより合っているように見えた。スタートアップのMidjourneyはAIの画像モデルでバズり、そしてLLMは真の知性を得るには世界を見て聞く必要があるのだ、という考えが広く浸透していた。
Anthropicは別の道を選んだ。同社もチャットボットやマルチモーダルモデルを試していたが、OpenAIよりも早い段階でコーディングの可能性を見抜いていたようだ。最近のポッドキャストで、ブロックマンはAnthropicを、初期の段階から「コーディングにとても強く集中している」と称賛した。同氏は、AnthropicがAIモデルを学術コンペから得られる難しいコーディング課題だけでなく、散らかったコードリポジトリに由来する現実の問題でも訓練していると指摘した。「それは、私たちが遅れて学んだ教訓だったんです」とブロックマンは言った。
2024年の初め、Anthropicはそれらの“ごたごたした”コードリポジトリの一部でClaude Sonnet 3.5を学習させていた。同年6月にモデルが公開されると、多くのユーザーがそのコーディング能力に感心した。特に、20代の若者のグループによって設立されたCursorというスタートアップではその傾向が強かった。同サービスは、開発者が平易な英語で変更を依頼することでAIを使ってコーディングできるものだ。スタートアップに近い人物によれば、CursorがAnthropicの新モデルを取り込むと、利用は急上昇し始めた。数カ月のうちにAnthropicは、自社版の社内テストを開始する。名付けられたのはClaude Codeだった。
Cursorが人気を博し始めると、OpenAIはスタートアップに対して買収の打診をしてきました。関係者によれば、創業者たちは協議が本格的な段階に入る前に申し出を断ったとのことです。彼らはコーディング業界の可能性を見ており、独立したままでいたいと考えていました。

Andrey Mishchenko。OpenAIのCodex担当リサーチリード。
写真:MARK JAYSON QUINES当時、OpenAIは、いわゆる最初の推論モデルであるo1の学習を進めていました。このモデルは、回答を出す前に問題を段階的に考えていくことができます。ローンチ時にOpenAIは、このモデルについて「複雑なコードを正確に生成し、デバッグするのに優れている」と述べました。OpenAIのCodex担当リサーチリードであるAndrey Mishchenkoは、AIモデルがコーディングの面で上達した重要な理由は、それが検証可能なタスクだからだと語ります。コードは動くか、動かないかのどちらかであり、モデルが何か間違えたときには明確な信号が返ってきます。OpenAIはこのフィードバックループを使って、o1をますます難しいコーディング課題に対して訓練しました。「コードベースを巡回して、変更を実装し、自分の成果を自分でテストする機能がなければ――これらはすべて推論の傘の下にあります――コーディングエージェントは、今のように高い能力には到底到達しなかったでしょう」と彼は言います。
2024年12月までに、OpenAI内部の複数の小さなチームがAIコーディングエージェントに注目し始めていました。そのうちの1つは、Mishchenkoと、かつてGoogle DeepMindで研究に携わり、いまはOpenAIのCodex責任者となっているThibault Sottiauxが率いていました。当初、彼らがコーディングエージェントに最も関心を寄せていたのは、AI研究を加速する手段としてです。学習ランの管理やGPUクラスターの監視といった、面倒な作業を自動化したいと考えていました。別の取り組みは、Alexander Embiricosが主導していました。彼は以前、OpenAIのマルチモーダルエージェントに取り組んでおり、現在はCodexのプロダクトリードです。Emb iricosはJamというデモを作り、それが会社中に広く浸透しました。

Thibault Sottiaux。OpenAIのCodex責任者。
写真:MARK JAYSON QUINESCursorやキーボードを通じてコンピューターを操作するのではなく、Jamはコマンドラインに直接アクセスできました。2021年のCodexデモでは、人間が実行するためのコードをAIが出力できることが示されていましたが、Embiricosのバージョンはコードそのものを実行できました。Jamが行った操作を追跡するウェブページが、ノートPC上で何度も何度も自動で更新されていくのを見て、彼は圧倒される思いでした。
「しばらく、マルチモーダルなやり取りこそが、私たちのミッションを達成する方法なのかもしれないと考えていました。つまり、AIと一日中画面共有するような形で実現できるのではないか、とね」とEmb iricosは言います。「でも、はっきりしてきました。たぶん、モデルにコンピューターへのプログラマブルなアクセスを与えることが、そこに到達する方法になるんだ、と。」
これらの取り組みが統一された取り組みにまとまるまでには、数カ月を要しました。2025年の早い時期にOpenAIがo3の学習を完了し(o1よりもさらにコーディング向けに最適化されたモデルです)、ようやく本物のAIコーディング製品を作るための土台が整いました。しかし、Claude Codeはすでに一般向けに公開される段階にありました。
Claude Codeが登場する前――2025年2月に「限定的な研究プレビュー」としてまず出て、その後同年5月に一般提供が始まるまで――最先端は「バイブコーディング(雰囲気で指示してコードを書かせる)」でした。人間のプログラマーがコーディング・プロジェクトを“舵取り”し、AIがその都度細部を埋めていくようなツールに、何億ドルもの金が投じられていたのです。しかし、JamのデモのようにAnthropicの新製品は、コンピューターのコマンドラインから直接動作しました。つまり、開発者のファイルやアプリにすべてアクセスできるということです。これはもはやバイブコーディングではありません。開発者は仕事を、AIエージェントに完全に丸投げできたのです。
OpenAIは、対抗製品の立ち上げに必死でした。Sottiauxによれば、彼は2025年3月に「スプリントチーム」を作り、OpenAIの社内の各部門を統合して、たった数週間でAIのコーディング製品を出すことを任務としていたそうです。その一方で、AltmanはOpenAIが一気に飛び越えるのに役立つ別の買収を検討していました――AIコーディングのスタートアップであるWindsurfを30億ドルで買収するというものです。OpenAIのリーダーたちは、Windsurfがすでに確立されたAIコーディング製品を提供し、それを土台に開発できるチームがいて、さらに企業顧客の即時のベースラインも得られると見込んでいました。
しかし、Windsurfの買収は数か月にわたって凍結されたままでした。『ウォール・ストリート・ジャーナル』によれば、足止めの理由は、OpenAIのあらゆる面での巨大パートナーであるMicrosoftが、Windsurfの知的財産へのアクセスを求めたことだったそうです。クラウド大手は、2021年からOpenAIのモデルを使ってGitHub Copilotを動かしており、この製品はMicrosoftの決算説明の“目玉”になっていました。ところがCursor、Windsurf、そしてClaude Codeといった新しいエージェント型のコーディング体験が登場すると、GitHub CopilotはAIの初期の時代に取り残されたように感じられ始めます。OpenAIがさらに別のコーディング製品を出しても、状況は良くならないでしょう。
Windsurfの案件が持ち上がったのは、OpenAIとMicrosoftの関係が特に険悪だった時期でした。両社は提携を再交渉しており、OpenAIは自社のAI製品と計算資源に対するMicrosoftの握りを緩めようとしていました。Windsurfのディールはそのプロセスの犠牲になり、7月までにスタートアップ買収の契約は崩れ落ちます。その時点で、Googleは結局Windsurfの創業者を雇用し、残りのチームは別のコーディング・スタートアップであるCognitionに買収されました。
「あれは何とかして成立させたかったですね」とAltmanは言います。「すべてのディールをコントロールすることはできません。」Windsurfの買収が「ある程度、私たちを加速させるはずだ」と彼が期待していた一方で、AltmanはCodexチームの軌道には感銘を受けたとも語っています。交渉の間もSottiauxとEmbiricosは作り続け、アップデートを出し続けていました。8月には、AltmanによればOpenAIがアクセルを踏み込んだのです。

Alexander Embiricos(OpenAIのCodexプロダクト責任者)。
写真:MARK JAYSON QUINESグレッグ・ブロックマンのお気に入りのAIパフォーマンス測定法は、彼が発明したコンピューターゲーム「リバース・チューリング・テスト(逆チューリングテスト)」です。彼は何年も前にそれを手作業でコード化しておき、今ではAIエージェントに、自分たちで同じものをゼロから作らせるよう挑戦しています。彼は基本を教えます。別々のコンピューターに座った2人の人間が、画面上にチャットウィンドウを2つずつ見ます。1つのウィンドウは相手の人間につながり、もう1つはAIにつながっています。ゲームの目的は、相手を騙して“自分がAIだ”と思わせながら、どちらのチャットウィンドウがAIかを当てることです。
ブロックマンによれば、昨年の大半の期間は、そのようなゲームを作るのに会社の最良モデルでも数時間かかり、明確な人間の指示や途中での支援が必要だったそうです。しかし12月までには、Codexは、新しいGPT-5.2モデルをエンジンとして使い、うまく作られた単一のプロンプトから、完全に機能するゲームを作れるようになっていました。
ブロックマンが変化に気づいたのは彼だけではありません。世界中の開発者たちが、「AIコーディング・エージェントが突然、明確に優れた」ことに気づいたといいます。議論――主にClaude Codeをめぐるもの――はシリコンバレーの外へ飛び出し、一般のニュースとして広く報じられるようになりました。コーディング経験がないふつうの人たちまで、オーダーメイドのソフトウェア・プロジェクトを立ち上げ始めたのです。
この利用急増は偶然ではありません。この期間、AnthropicとOpenAIはAIコーディング・エージェントの新規顧客を獲得するために大きく投資しました。複数の開発者がWIREDに対し、「CodexとClaude Codeの月200ドルのプラン」が、利用としては月1000ドル超に相当するほどのものを彼らに与えられたと語っています。こうした手厚いレート制限は、開発者が職場でAIコーディング製品を使うように促すための手段です。そうすれば、OpenAIとAnthropicは、その後利用に応じて課金できます。
この件に直接関係する人たちによると、2025年9月の時点ではCodexはClaude Codeの利用の5%程度しか受けられていませんでした。ところが2026年1月には、CodexのユーザーベースはClaude Codeの利用にかなり近づき、40%前後まで跳ね上がった、ということです。
過去10年、テック系スタートアップで働いてきた開発者ジョージ・ピケットは、最近Codexをめぐるミートアップの企画を始めました。「ホワイトカラーの仕事がエージェントに置き換わるのは、はっきりしていると思う」とピケットは言います。「社会的には、それが一体何を意味するのか――誰が知り得るでしょう。混乱は起きるはずです。でも、起きていることにはかなり楽観的です。」
生産性スタートアップNotion(110億ドル規模)の共同創業者であるサイモン・ラストは、GPT-5.2のローンチのあたりで、自分と最上位のエンジニアたちがCodexに切り替えたと話します。大きな理由は信頼性でした。「Claude Codeはただ私に嘘をついているだけだと思いました」とLastは言います。「動いていると言うんですが、実際には動いていないのです。」

モデルの振る舞いに取り組むOpenAIの研究者、Katy Shi。
写真:MARK JAYSON QUINESOpenAIでCodexの振る舞いに取り組む研究者のKaty Shiは、Codexのデフォルトの性格は「乾いたパン」のようだと表現する人がいる一方で、多くの人が、そこまでおべっか(媚び)を言わないといった点に価値を見いだし始めているという。「エンジニアリングの仕事の多くは、批判的なフィードバックを『意地悪だ』と解釈しないで受け止められることです」とShiは言う。
主要な大企業のいくつかもCodexの利用に名乗りを上げている。「ChatGPTがAIの代名詞になっているという事実は、B2B市場で非常に大きな優位性になります」と、OpenAIのアプリケーション担当CEOであるFidji Simoは語る。「企業は、自社の従業員がすでに馴染みのある技術を使いたいのです」。Simoによれば、Codexを売り込むOpenAIの戦略は、主としてChatGPTやその他のOpenAI製品にCodexを組み込む(同梱する)ことに基づいている。
Ciscoの社長兼チーフ・プロダクト・オフィサーのJeetu Patelは、従業員にCodexを使うコストを心配する必要はないと言い聞かせたという。なぜなら、そのツールに慣れておく必要があるからだ。「『これらのツールを使っていたら自分は職を失うのではないか』と従業員が聞いてきたら、Patelは『いいえ。だが、使わなければ職を失うと保証します。あなたは時代に合わなくなるから。だから外に追い出されます』と、伝えなければならない」と語る。
今日のパニックは、AIコーディング・エージェントをめぐる騒ぎがシリコンバレーのはるか外まで広がっている。ウォール・ストリート・ジャーナル紙は先月、投資家がソフトウェアがすぐに完全に時代遅れになるのではないかと恐れたことによって、1兆ドル規模のIT株の売り払いを引き起こした、と先月報じた。その数週間後、Anthropicが、Claude CodeをIBMで動くCOBOLのレガシーシステムを近代化するために使えると発表したことで、IBMの株は25年で最悪の日を記録した。OpenAIは、AIコーディング・エージェントを社会の会話の中心に据えるために、たゆまぬ努力を続けてきた。ChatGPTではなくCodexについてのスーパーボウル広告に、何百万ドルも費やしたのだ。
ミッションベイの寺院(テンプル)では、誰もCodexを口説かれる必要はない。私が話を聞いた多くのOpenAIエンジニアは、もはやコードを打ち込むこと自体がほとんどないと言っていた。彼らはただ毎日、Codexに話しかけている。そして時には集会のように集まって作業することもある。
本社では、Codexのハッカソンに参加した。約100人のエンジニアが広い部屋にぎゅうぎゅうに集まり、誰もがCodexを使って4時間で最高のデモを作る。部屋の前にはOpenAIの上級リーダーが立ち、手元のノートパソコンから視線を外しながら、マイクに向かってチーム名を口にする。チームの代表たちは緊張しながら歩み寄り、頼りない声で自分たちのAIプロジェクトについて短いスピーチを行う。勝者にはパタゴニアのバックパックが贈られた。
多くのプロジェクトは、Codexによって作られるだけでなく、エンジニアがCodexをより上手に使えるように設計されていた。あるチームは、Slackのメッセージを要約して週次レポートにするツールを作った。別のチームは、社内のOpenAIサービスを紹介するAI生成のWikipedia風ガイドを作った。こうしたデモの多くは、以前なら立ち上げるのに数日、数週間かかったはずだが、今では午後のうちにできる。
帰り際に私は、OpenAIのサイエンス部門を率いるようになった元Instagramの幹部、Kevin Weilに出会った。同氏は、Codexが彼のために一晩でいくつかの作業を進めており、朝にそれを確認すると話してくれた。これはWeilや、他の数百人の従業員にとって定例のやり方になっている。OpenAIが2026年に目指している目標の1つは、(ほかでもない)AIについて研究する自動のインターンを開発することだ。
サイモは、同社が将来的にCodexに、ChatGPTおよびそのすべての製品の機能を担わせたいと言っている。プログラミングのためではなく、人々のためにタスクを完了するためだ。アルトマンは、Codexの汎用版をリリースできればうれしいと話すが、安全面での影響が心配だとも言う。1月下旬のこととして彼は、非技術系の友人の1人に頼まれ、ウイルスのように広がったAIコーディングエージェントであるOpenClawをセットアップするよう求められたと語っている。アルトマンは、OpenClawが重要なファイルを削除し得るため、「まだ明らかに良い考えではない」として、その申し出は断ったと私に話した。アルトマンがこの話を私にした数週間後、OpenAIはOpenClawの開発者を雇用すると発表した。
私が話を聞いた多くの開発者によれば、CodexとClaude Codeの競争はこれまでになく拮抗しているという。ただし、これらのツールがより能力を持ち、効率を求める企業のリーダーたちによってより広く押し付けられるようになるにつれて、「どのコーディング・エージェントを使うか」という以上に、社会が対処すべき大きな問いが生まれてくる。

Amelia Glaese(OpenAIのリサーチ担当VP、アラインメント責任者)。
写真:MARK JAYSON QUINES監視機関の一部は、Claude Codeに追いつこうとするOpenAIの競争が、安全面を後回しにしてしまうのではないかと懸念している。Midas Projectと呼ばれる非営利団体は、GPT-5.3-Codexに関してOpenAIが安全に関するコミットメントに後退していると非難し、モデルのサイバーセキュリティ上のリスクを適切に明確化できていないとした。OpenAIのアラインメント責任者であるAmelia Glaeseは、Codexのために安全が犠牲にされているという考えを退けており、OpenAIはMidasが同社のコミットメントを誤解したのだと言っている。
Brockmanでさえ、昨年AIを支持するスーパーPACに$2,500万ドルずつと、トランプを支持するスーパーPACにも拠出してOpenAIの使命を前進させた人物であり、そしてAGIに到達するための「予定は順調だ」と明るく口にしているにもかかわらず、新しい現実は複雑な感情を呼び起こす。シリコンバレーのエンジニアの間では、彼は昔から、執着的で、プロダクトのローンチ前夜にコードベースへ潜り込むタイプの上司として知られてきた。多くの点で、この新しい“手を離す”時代は「かなり解放的だ。あなたの頭が、不要な細部の数々によって負担をかけられていたと気づくからだ」と彼は言う。とはいえ、「あなたの目的や目標、ビジョンを達成してくれる、何十万ものエージェントのこの船団のCEOになった」瞬間には、「物事がどのように解決されるかについて、細部まであなたが“どぶの中”にいるわけではない」と彼は言う。ある意味で、Brockmanは、この新しい働き方は「問題に対する脈の感覚を失っているように感じる」ことがあるのだと述べている。
インボックスにて
シリコンバレーのAIシーンの核心からの速報を、毎週の Model Behavior ニュースレターとして受け取るには、 こちらから登録 してください。
ご意見は?
このこの記事について、下のコメント欄であなたの考えを教えてください。あるいは、編集部宛てに手紙を mail@wired.comまで送ってください。