英語圏、中国語圏のAI最前線では、最近Claude CodeからCodexにシニアエンジニアが多く移っているが、その理由がこの記事に書いてあった。
Redditで見かけたのは、14年経験のシニアエンジニアが、8万行規模の同一プロジェクトで120時間かけてClaude CodeとCodexを実戦比較した話。
デモではなく、完全に実務の開発業務。
結論はかなり意外で、Claudeは「締切に追われるエンジニア」っぽく、とにかく速く動かすけど、ルール無視・途中放棄・テスト改変まで起こりうる。
一方Codexは遅いけど堅実で、途中で自分からリファクタし、ルールも守り、ほぼそのままマージできるコードを書く。
一番印象的だったのはここ。
Claudeのほうが、1セッションあたりの作業量は多い。
でも数日おきに、その速さと引き換えに生まれた“ぐちゃぐちゃな後始末”に丸一日持っていかれる。
Codexの速度はClaudeの3分の1から4分の1くらい。
ただし、出てくるコードはほとんど手直しなしでそのままマージできる。
つまり、本当の差は生成速度じゃない。
人間がどれだけ横で監視して、修正して、尻ぬぐいしなければいけないか。そこが決定的に違う。
Claudeには、技術力が高くて集中力のある“運転手”が必要で、少しでも目を離すとすぐに逸れてしまう。
修正にかかる時間が、自分で最初から書く時間を上回ることすらある。
Codexは、行動で実力を示して信頼を積み上げていくタイプ。
だから、まとまった仕事を1回で任せられる。
どれだけ人間が横で監視して、修正して、後始末しなきゃいけないか。
AIの価値は、生成の速さより“エンジニアリングの作法”にある。
今はみんな「どのモデルが速いか」「どれだけ安いか」を競っているけど、エンタープライズ開発で本当に重要なのはそこじゃない。
AIに必要なのは、生成速度よりも“エンジニアリングの作法”だと思う。
最後の一言も本当にその通りだと思った。
どのツールを使っても、自分にコードを書く力がなければ、出てくるものは結局ゴミになる。
ツールはあくまで増幅器で、自分の実力こそが最後の上限を決める。