Claude CodeとCodexのAuto Mode、40時間でわかった分け方

note / 5/15/2026

💬 OpinionSignals & Early TrendsIdeas & Deep AnalysisTools & Practical Usage

Read original →

共有:

Key Points

Claude CodeとCodexのAuto Modeを比較し、40時間の利用で分かった実務上の使い分けを整理している。
Auto Modeの挙動差（タスク分解・実行の進め方・失敗時の立て直し等）に触れ、期待値の調整方法を示している。
どのような開発/作業シーンでAuto Modeが向き、逆に手動介入が必要になりやすい条件をまとめている。
企業AI担当の観点から、運用設計や評価（安全性・品質・生産性の見方）につながるポイントに言及している。

Claude CodeとCodexのAuto Mode、40時間でわかった分け方

アライ｜企業AI担当

2026年5月14日 21:27

最近の自分は、Claude Code に note 本文を書かせて、Codex にサムネ生成や公開準備を回し、次の記事の情報収集を走らせている。 AI ニュース通知で「22歳の開発者が新しいオープンモデル "OpenMithos" を公開した」という話が流れてきて、帰ったら色々触ろうと思いながら note の最終チェック中。

朝起きると、次の記事の叩き台や調査メモがある程度そろっている。この「並列化」が、Auto Mode 時代の本質になり始めている。

🤖 まず、Auto Modeとは？

Auto Modeで書いたこの記事の初稿が、63点だった。

何が悪かったか。全部書く。

文字数が約2,500字（目標5,000字の半分）
md テーブルが2箇所残っていた（note で崩れる P0 ルール違反）
「Auto Modeとは？」が箇条書きだけで定義になっていない
具体例がゼロ——「強み・弱み」と書いてあるが、何のコードを・どうやったかが一切ない

そして届いた修正指示がこれだ。

「90点の記事にしてくれ。俺もなんか具体例ないし前の記事ににてるしでだめだわ。ダメな部分mdに保存してみせたほうが説得力出るんじゃねぇか？今現在も。このプロンプト事載せる。」

これが Auto Mode の現実だ。

Claude Code も Codex も、デフォルトは「実行前に人間が許可する」設計だ。ファイルを編集する前に確認。コマンドを実行する前に確認。 1日に何百回も「OK」を押し続ける。

Auto Mode はここを変える。

許可の粒度を「毎回」から「最初の一回」に変える機能。

起動時に方針と権限範囲を渡せば、あとは AI が自律判断で連続実行する。ファイルを読む、コードを書く、実行する、エラーを直す——人間が画面の前にいなくても、作業が進む。

「AIに聞く」から「AIに仕事を任せる」への変化。 ただし、渡す方針の質がそのまま出力の質になる。 「なんとなく書いて」と指示した自分が、63点の原因だった。

🚀 Auto Mode は、何を変えたか

先週は「Claude Code制限倍増。SpaceX提携で何が変わるか」と「今週のAI業界は何が変わったか」で、Anthropic がインフラ側で何を仕込んだかを書いた。

Auto Mode は、その仕込みの 手元に効いてくる側 の話だ。

Auto Mode 以前の AI エージェントは、こんな感じだった。

「次、ファイルを編集していいですか?」「実行していいですか?」

1日200回くらい、こういう確認を押していた。人間が一個一個許可するので便利ではあるけど、結局付きっきりになる。だから、本当に楽になったとは言いにくかった。

Auto Mode はここを変えた。最初に方針を渡せば、自分で判断して連続実行する。寝てる間に作業が進む、というのが一番わかりやすい変化だ。

ただし、寝てる間に進むのは「方針の範囲内」だけだ。方針が雑なら、雑な作業が進む。

🤖 Claude Code Auto Mode の使い心地

Claude Code Auto Mode を3日間、ほぼ放置で動かした。

強み: 「文脈を読む」精度が高い

具体的には、note-pipeline の src/article_generator.py のリファクタリングを任せた。

「コメント量を減らして、型ヒントを揃えて」とだけ伝えた。 Claude Code は何をしたか。

ファイルを読んで関数の一覧を把握
既存のコーディングスタイル（docstringの書き方、変数命名規則）を学習
変更差分が最小になるように手を入れた

結果、「このコード、自分が書いたみたいだ」という感覚の出力になった。既存の文体に馴染んでいた。

既存の「文脈」に馴染む能力。これが Claude Code の本質だ。

弱み: 「未知の領域」だと判断が止まる

逆に、まだコードが存在しないゼロベースの設計は遅い。「文脈を読みたい」性格上、何もない場所では迷う。判断のたびに「念のため」と確認に戻ってくることがあった。

3日間で一番時間を使ったのは、新規スクリプトの骨格を決める部分だ。既存コードが参照できる場面になると、急速に動き出した。

一言でいうと

既存の家を大改装するのが得意な、几帳面な大工。

新築から頼むと、基礎を固めるのに時間がかかる。それを知った上で使えばいい。

🧱 Codex Auto Mode の使い心地

Codex Auto Mode は、過去 Codex とは別物に進化していた。

強み: 「ゼロから組み立てる」スピードが速い

実際にやらせたのは、サムネ生成スクリプト generate_thumbnail.py の新規作成だ。

「Gemini API でサムネを生成するスクリプト、BEFORE/AFTER 形式で、タイトルはこれ、テーマはこれ」とだけ渡した。 45分後、動くスクリプトが完成していた。

「とりあえず動くものを作る」が、Claude Code よりずっと速い。

設計書がなくても、指示書1枚で家が建つ。これが Codex の本質だ。

弱み: 「既存コードへの馴染み」が弱い

複雑な既存コードベースに新しい機能を入れる時、Codex は周辺コードを少しだけ書き換える癖がある。本人の意図的な変更で、間違いではない。ただ、レビューする側からは「なぜここを?」と聞きたくなる場面が出る。

「改装」を頼むと、建て替えてくる可能性がある。既存コードを渡す時はスコープを細かく区切る。

一言でいうと

更地に家をゼロから建てるのが得意な、勢いのある建設チーム。

⚠️ 同時運用の失敗3つ

これが一番痛い学びだった。

失敗1: 同じファイルを並行編集 → コンフリクト多発

両方に同じディレクトリを触らせると、互いの変更を上書きする。 git worktree で物理的に作業空間を分けない限り、同時並行は事故る。

今は Claude Code が main を使い、Codex は専用 worktree で動かしている。これを決めるまでに3日かかった。

失敗2: 「片方の判断を、もう片方に検証させる」が遅い

「Claude Code の出力を Codex にレビューさせる」をやったが、これは思ったより遅い。 AI に AI を検証させると、説明と弁明の応酬になって時間が消える。レビューは人間がやった方が早い。

「AIに判断させる」と「AIに検証させる」は別物だ。混同すると時間が無限に消える。

失敗3: コンテキスト切り替えで疲弊

人間側が両方の操作感を覚えるのに体力を使う。 Claude Code は丁寧、Codex は速い、と毎回頭を切り替える。 1日のうち、Claude Code 日と Codex 日を分けた方が楽だった。

道具を2つ使えるのは強い。でも頭を2つ使えるわけじゃない。

🗺️ 役割分担表 (40時間使った結論)

両方触ってわかった役割分担。

どっちもできる範囲は重なっている。違うのは、「どっちが楽か」だ。

🎯 1個だけ選ぶなら、どっち?

40時間使い込んだ結論はかなりシンプルだった。

新規構築は Codex、既存改装は Claude Code。

自分自身は、進行中の note-pipeline リポジトリがあるので、メインは Claude Code。 Codex は、個別の小さなツールを試作する用に使っている。

両方を「使い分け」られるのが一番強い。でも、どっちか1個に絞るなら、自分の今やっている仕事のタイプで決める。

📂 自分が実際に使っているmd: Claude / Codex 役割分担

40時間の使い分けの結果、Claude / Codex の役割を1ファイルに固定した。プロジェクトに1枚置くだけで、両AIが同じ参照を見て動く。引き継ぎが減る。

# AI協調 役割分担 (Claude / Codex)

## 大原則
- Claude = 本文・調査・memory・実装系の中身
- Codex = タイトル・図・サムネ・publish の見た目と仕上げ

## 工程別の主管
- 本文執筆 → Claude
- タイトル微調整 → Codex
- 図生成・配置 → Codex
- サムネ生成 → Codex
- publish 実行 → Codex
- publish 後の memory 反映 → Claude

完全版はプロジェクト直下の .ai-sync/ROLE_DIVISION.md に置いてある。ハンドオフのフォーマットまでこのファイル1つに集約しているので、両AIがこれを開けばすぐ動ける。

「Claudeに頼んだ仕事をCodexが上書きする」のような事故は、このファイルを置いてから一度も起きていない。

🌟 最後に

Auto Mode が出た今週は、AIエージェントが「便利な道具」から「夜中も働く同僚」になる、その境目だった。

この記事を63点から直す過程で気づいたことがある。 Auto Mode の品質は、mdの改善の繰り返しだ。

AIが作る→AIが修正する→自分が見る→FBしてワークフローを見直す。

このワークフローを見直すのが大事でmdが育っていく。これがどんどん積み重なって、自分の修正時間が縮小されている。

ツールが自律化すればするほど、人間の「方針の精度」が問われる。
「Auto Mode にした、あとは任せた」の後に結局人はFBをして、そのFBをみてAIを進化させる。結局Noteのような文章の舞台であれば頭のいいLLMはskillとmdの工夫さえすれば今は自動化がどんどんすすんでいく時代なんだと実感した。

AIが賢くなった分、ｍｄへのＦＢする技術の差が、仕事の差になる。

あなたが渡している指示やナレッジは、何点ですか?

スキを押していただけると次の記事を書く大きな励みになります。

アライ｜企業AI担当｜note 【発信内容】 🧠 AIの本質理解：流行に左右されない一生モノのスキル 💰 個人への応用：本業/副業の時短・収入UP・人生の note.com

#AI #ClaudeCode #Codex #Anthropic #OpenAI #生成AI #AIエージェント #AutoMode #プロンプト

ダウンロード

copy

いいなと思ったら応援しよう！

チップで応援する

Black Hat USA

AI Business

From Field Notes to Foundation: Structuring Data for AI-Powered Reports

Dev.to

Metagenomics Market Trends, Demand & Forecast Analysis, 2025-2033

Dev.to

How I Evaluate Agent Skills Before Installing Them

Dev.to

internlm/Intern-S2-Preview · Hugging Face

Reddit r/LocalLLaMA

Claude CodeとCodexのAuto Mode、40時間でわかった分け方

Key Points

Claude CodeとCodexのAuto Mode、40時間でわかった分け方

🤖 まず、Auto Modeとは？

🚀 Auto Mode は、何を変えたか

🤖 Claude Code Auto Mode の使い心地

強み: 「文脈を読む」精度が高い

弱み: 「未知の領域」だと判断が止まる

一言でいうと

🧱 Codex Auto Mode の使い心地

強み: 「ゼロから組み立てる」スピードが速い

弱み: 「既存コードへの馴染み」が弱い

一言でいうと

⚠️ 同時運用の失敗3つ

失敗1: 同じファイルを並行編集 → コンフリクト多発

失敗2: 「片方の判断を、もう片方に検証させる」が遅い

失敗3: コンテキスト切り替えで疲弊

🗺️ 役割分担表 (40時間使った結論)

🎯 1個だけ選ぶなら、どっち?

📂 自分が実際に使っているmd: Claude / Codex 役割分担

🌟 最後に

いいなと思ったら応援しよう！

Related Articles

Black Hat USA

From Field Notes to Foundation: Structuring Data for AI-Powered Reports

Metagenomics Market Trends, Demand & Forecast Analysis, 2025-2033

How I Evaluate Agent Skills Before Installing Them

internlm/Intern-S2-Preview · Hugging Face

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer