「AIにコードを書かせたいけど、Claude CodeとCodex、どっちを使えばいいの?」

2026年、AIコーディングツールは群雄割拠の時代。その中でも特に注目されているのが、AnthropicのClaude CodeとOpenAIのCodexだ。どちらもターミナルで動くAIエージェントで、ファイルの読み書き、テスト実行、git操作まで自律的にこなす。

この記事では、「で、結局どっちがいいの?」という疑問に対して、料金・性能・得意分野の3つの軸で比較する。あなたの開発スタイルや予算に合ったツールが見つかるはずだ。

1. Claude CodeとCodex、ざっくり何が違う?

まず「AIコーディングツールって何?」という方へ。どちらもターミナル(黒い画面)で動くAIアシスタントで、あなたの代わりにコードを書いたり、バグを直したり、テストを実行したりしてくれる。いわば「AIのペアプログラマー」だ。

項目 Claude Code Codex
開発元 Anthropic OpenAI
使い方 ターミナル / IDE / デスクトップアプリ ターミナル / IDE / ChatGPT画面
AIモデル Claude Sonnet 4.6 / Opus 4.6 GPT-5.4 / GPT-5.3-Codex
オープンソース ❌(プロプライエタリ) ✅(CLI部分はApache 2.0)
最低料金 $20/月(Proプラン) $20/月(Plusプラン)

ここで大きなポイントがある。Codexには「ターミナル版(CLI)」と「クラウド版」の2つのモードがある。ターミナル版はClaude Codeと同じくローカルで対話しながら使う。クラウド版はChatGPTの画面からタスクを投げて、完了を待つ非同期スタイルだ。Claude Codeはローカル専用。この記事では主にターミナル版同士を比較しつつ、Codexのクラウド版ならではの強みにも触れていく。

Claude Code vs Codex アーキテクチャ比較

2. 料金を比較する

まず気になるのは料金。両方とも最低$20/月から使えるClaude公式料金ページChatGPT公式料金ページより、2026年3月時点)。

プラン Claude Code Codex
無料 ❌ 利用不可 ❌ 利用不可
$20/月 Pro(基本使用量付き) Plus(基本使用量付き)
$100/月 Max 5x(5倍の使用量)
$200/月 Max 20x(20倍の使用量) Pro(約6〜7倍の使用量)

「使用量」の考え方が違う点に注意。Claude Codeはトークン消費量(AIとのやり取りの文字数に応じた量)で管理される。Codexはクレジット制で、モデルやタスクの複雑さによって消費クレジットが変わる。どちらも$20/月プランで日常的な開発作業には対応できるが、大量にコードを書かせるならMaxやProプランが必要になる。

「トークンとは?」 AIが文章を処理する最小単位のこと。日本語の場合、おおよそ1文字=1〜2トークン。AIに長いコードを読ませたり、長い回答を生成させるほどトークンを多く消費する。

APIキーを使って従量課金で使うことも可能だ。その場合の料金は以下のとおり(100万トークンあたり、Anthropic API料金表Codex料金ページより)。

モデル 入力 出力
Claude Sonnet 4.6 $3.00 $15.00
Claude Opus 4.6 $5.00 $25.00
codex-mini(Codex CLI用) $1.50 $6.00

API従量課金で見ると、Codexのcodex-miniはClaude Sonnetの半額以下で使える。ただし、モデルの性能も異なるので単純な価格比較だけでは判断できない。次のセクションで性能を見てみよう。

料金の全体像はClaude vs ChatGPT 料金比較記事で詳しくまとめている。

3. 性能(ベンチマーク)を比較する

AIコーディングツールの性能を測る指標として、業界で広く使われているSWE-benchがある(データはSWE-bench公式リーダーボードおよび各社公式ブログより)。

「SWE-benchとは?」 実際のオープンソースプロジェクトから集めた「バグ修正タスク」をAIに解かせて、正しく修正できた割合を測るベンチマーク。スコアが高いほど、実践的なコーディング能力が高いとされる。

モデル SWE-bench Verified
Claude Opus 4.6 80.8%
Claude Sonnet 4.6 79.6%
GPT-5.4(Codex最新) 78.2%
GPT-5.3-Codex 78.0%

2026年3月時点では、Claude Opus 4.6が80.8%でトップ。ただし差は数ポイントであり、実際の開発作業ではこの差を体感できないことも多い。

注意点として、OpenAI自身がSWE-bench Verifiedの信頼性に疑問を呈しており(テストデータの汚染問題)、より難易度の高いSWE-bench Proを推奨している。SWE-bench Proでは GPT-5.4が57.7%を記録しているが、Claude側の同条件スコアは公開情報が限られるため単純比較は難しい。

ベンチマークはあくまで参考値であり、「あなたのプロジェクトでどちらが使いやすいか」は実際に試してみるのが一番確実だ。

4. 機能の違いを比較する

両ツールの主要な機能を比較してみよう。

機能 Claude Code Codex
ファイル読み書き
コマンド実行
Git操作・PR作成
画像の読み取り
並列エージェント ✅ サブエージェント ✅ サブエージェント
外部ツール連携(MCP)
IDE連携 VS Code・JetBrains VS Code・Cursor
クラウド非同期実行 ✅(Codex Cloud)
PC画面の操作 ✅(Computer Use)

基本機能はほぼ同じだ。差が出るのは以下の2点。

Codexだけの機能:クラウド非同期実行

Codexには、ChatGPTの画面からタスクを投げてクラウド上で非同期に処理させる「Codex Cloud」モードがある。タスクを投げたら完了を待たずに別の作業ができる。複数タスクの同時処理も可能で、7時間以上かかる長時間タスクにも対応する。

Claude Codeにはこのモードがない。ターミナルでリアルタイムに対話しながら進める。その分、途中で方針を変えたり、細かい修正指示を出したりするのがスムーズだ。

Claude Codeだけの機能:Computer Use

Claude CodeにはComputer Useという独自機能がある。PCのブラウザやアプリを直接操作できる機能で、「コードを修正→ブラウザで結果を確認→問題があればさらに修正」という一連の作業をAIだけで完結させられる。Codexにはこの機能がない。

プロジェクト設定ファイル:CLAUDE.md vs AGENTS.md

どちらのツールも、プロジェクトのルート(一番上のフォルダ)に設定ファイルを置くことで、AIにプロジェクト固有のルールを伝えられる。

  • Claude Code → CLAUDE.md:コーディング規約、ビルドコマンド、アーキテクチャの方針などを書く。セッション間で引き継がれるAIへの「引き継ぎメモ」
  • Codex → AGENTS.md:同じ発想のファイル。こちらはLinux Foundation傘下のAgentic AI Foundationがオープン標準として策定しており、Codex以外のツール(Google Jules、Cursor等)でも使える

5. それぞれの得意・不得意

Claude Codeが得意なこと

  • 大規模なリファクタリング:数十ファイルにまたがるコード変更をリアルタイムで見ながら進められる。途中で「やっぱりこの方針で」と方向転換もすぐできる
  • ローカル環境を使ったテスト:あなたのPCのデータベースやDockerに直接アクセスして、実環境に近い状態でテストを回せる
  • 画面の確認まで自動化:Computer Use機能でブラウザ操作もAIに任せられる。「コードを書いて→ブラウザで確認して→修正」まで一気通貫
  • Windows対応:macOS・Linux・Windowsで動作する(Codex CLIのWindows対応は実験的)

Claude Codeが不得意なこと

  • タスクを投げて放置、ということができない(リアルタイム対話が前提)
  • 作業中はターミナルを占有する
  • ソースコードは非公開(プロプライエタリ)

Codexが得意なこと

  • タスクの並列処理:Codex Cloudを使えば、複数のバグ修正を同時に投げてまとめてレビューできる。「10個のバグを一気に片付けたい」場面に強い
  • 非同期ワークフロー:タスクを投げたら自分は別の作業に集中できる。結果はPR(プルリクエスト)として出力される
  • ChatGPTからの利用:ターミナルを使わなくても、ChatGPTの画面からコーディングタスクを依頼できる。コマンドラインに慣れていない人でも使いやすい
  • CLI版がオープンソース:Apache 2.0ライセンスでソースコードが公開されており、中身を確認したりカスタマイズしたりできる

Codexが不得意なこと

  • クラウド版は途中で方針を変えられない(完了後にフィードバック)
  • クラウド版はローカルのデータベースやAPIキーに直接アクセスできない
  • CLI版のWindows対応は実験的(WSL推奨)
  • PC画面の操作機能がない

6. こんな人にはこっち ─ 使い分けガイド

ここまでの比較をもとに、場面別のおすすめを整理する。

「AIと対話しながらコードを書きたい」

→ Claude Code。「ここをこう変えて」「やっぱり別の方法で」とリアルタイムでやり取りしながら開発を進められる。大規模なリファクタリングや、複雑な設計判断を伴う作業に向いている。

「タスクを投げて、自分は別の作業をしたい」

→ Codex(Cloud版)。「この機能を実装して」「このバグを直して」とタスクを投入したら、あとは完了を待つだけ。複数タスクの同時処理もできるので、時間を効率的に使える。

「ターミナルに慣れていない」

→ Codex(Cloud版)。ChatGPTの画面から「このリポジトリのこのバグを直して」と日本語で指示するだけで使える。コマンドラインの知識は不要。

「Windowsで使いたい」

→ Claude Code。WindowsにネイティブまたはWSLで対応している。Codex CLIのWindows対応は実験的で、WSL推奨。

「API従量課金でコストを抑えたい」

→ Codex。codex-miniモデルのAPI料金はClaude Sonnetの半額以下(入力$1.50 vs $3.00/百万トークン)。ただし性能差があるので、コストと品質のバランスは実際に試して判断するのがよい。

「予算があるなら両方使う」

Claude Pro($20/月)+ ChatGPT Plus($20/月)= $40/月で両方のツールが使える。対話しながら進めたい場面ではClaude Code、独立した小タスクを大量にさばきたい場面ではCodex Cloudと使い分けるのが最も効率的だ。AIモデルの得意分野も異なるので、両方使える環境があると選択肢が広がる。

7. よくある質問

Q. GitHub Copilotとは何が違うの?

Copilotは主にエディタ内で「次の1行」を予測して補完するツール。Claude CodeやCodexはエージェント型で、「この機能を作って」と指示すれば、ファイルの作成からテスト実行、PR作成まで自律的に行う。作業の粒度がまったく違う。Copilotは「タイピングの補助」、Claude Code/Codexは「タスクの委任」というイメージだ。

Q. 機密性の高いコードを扱っても大丈夫?

どちらもビジネス/エンタープライズプランでは、会話データがAIの学習に使われない仕組みがある。Claude Codeはローカルで動作し、クラウドに送信されるのはAPI通信(AIへの質問と回答)のみ。Codex CLIも同様にローカル実行。Codex Cloudはクラウド上のコンテナで動くが、デフォルトでインターネットから隔離されている。機密性が特に高い場合はエンタープライズプランの検討をおすすめする。

Q. 無料で試す方法はある?

2026年3月時点では、Claude Code、Codexとも無料プランでは利用できない。最低でも$20/月のサブスクリプションか、APIキーの購入が必要だ。APIキー方式なら使った分だけの支払いなので、少額から試すことは可能。

Q. どちらが将来性がある?

これは筆者の見解になるが、どちらも活発にアップデートされており、機能差は急速に縮まっている。Claude CodeはClaudeのエコシステム全体との連携が強み。Codexはオープンソース戦略とChatGPTの巨大なユーザーベースが強み。「どちらか一方が消える」という状況にはなりにくく、競争が続くことで両方とも進化していくと見ている。※これは公式見解ではなく筆者の推測です。

まとめ

Claude CodeとCodexは、どちらも強力なAIコーディングツールだ。基本機能は似ているが、使い方の思想が異なる。

  • Claude Code = AIとリアルタイムで対話しながら開発。大規模な変更、複雑な判断を伴う作業、画面操作の自動化が得意
  • Codex = タスクを投げて任せるスタイルも可能。小タスクの並列処理、ChatGPTからの手軽な利用が得意

迷ったら、まずは$20/月のプランでどちらか一方を試してみよう。AIコーディングツールは使ってみないと自分との相性がわからない。両方試して、自分の開発スタイルに合う方をメインにするのがベストだ。

参考リンク

※ 本記事の情報は2026年3月時点のものです。料金やベンチマークスコアは変更される可能性があります。最新情報は各公式サイトをご確認ください。