「AIにコードを書かせたいけど、Claude CodeとCodex、どっちを使えばいいの?」
2026年、AIコーディングツールは群雄割拠の時代。その中でも特に注目されているのが、AnthropicのClaude CodeとOpenAIのCodexだ。どちらもターミナルで動くAIエージェントで、ファイルの読み書き、テスト実行、git操作まで自律的にこなす。
この記事では、「で、結局どっちがいいの?」という疑問に対して、料金・性能・得意分野の3つの軸で比較する。あなたの開発スタイルや予算に合ったツールが見つかるはずだ。
目次
1. Claude CodeとCodex、ざっくり何が違う?
まず「AIコーディングツールって何?」という方へ。どちらもターミナル(黒い画面)で動くAIアシスタントで、あなたの代わりにコードを書いたり、バグを直したり、テストを実行したりしてくれる。いわば「AIのペアプログラマー」だ。
| 項目 | Claude Code | Codex |
|---|---|---|
| 開発元 | Anthropic | OpenAI |
| 使い方 | ターミナル / IDE / デスクトップアプリ | ターミナル / IDE / ChatGPT画面 |
| AIモデル | Claude Sonnet 4.6 / Opus 4.6 | GPT-5.4 / GPT-5.3-Codex |
| オープンソース | ❌(プロプライエタリ) | ✅(CLI部分はApache 2.0) |
| 最低料金 | $20/月(Proプラン) | $20/月(Plusプラン) |
ここで大きなポイントがある。Codexには「ターミナル版(CLI)」と「クラウド版」の2つのモードがある。ターミナル版はClaude Codeと同じくローカルで対話しながら使う。クラウド版はChatGPTの画面からタスクを投げて、完了を待つ非同期スタイルだ。Claude Codeはローカル専用。この記事では主にターミナル版同士を比較しつつ、Codexのクラウド版ならではの強みにも触れていく。
2. 料金を比較する
まず気になるのは料金。両方とも最低$20/月から使える(Claude公式料金ページ・ChatGPT公式料金ページより、2026年3月時点)。
| プラン | Claude Code | Codex |
|---|---|---|
| 無料 | ❌ 利用不可 | ❌ 利用不可 |
| $20/月 | Pro(基本使用量付き) | Plus(基本使用量付き) |
| $100/月 | Max 5x(5倍の使用量) | — |
| $200/月 | Max 20x(20倍の使用量) | Pro(約6〜7倍の使用量) |
「使用量」の考え方が違う点に注意。Claude Codeはトークン消費量(AIとのやり取りの文字数に応じた量)で管理される。Codexはクレジット制で、モデルやタスクの複雑さによって消費クレジットが変わる。どちらも$20/月プランで日常的な開発作業には対応できるが、大量にコードを書かせるならMaxやProプランが必要になる。
「トークンとは?」 AIが文章を処理する最小単位のこと。日本語の場合、おおよそ1文字=1〜2トークン。AIに長いコードを読ませたり、長い回答を生成させるほどトークンを多く消費する。
APIキーを使って従量課金で使うことも可能だ。その場合の料金は以下のとおり(100万トークンあたり、Anthropic API料金表・Codex料金ページより)。
| モデル | 入力 | 出力 |
|---|---|---|
| Claude Sonnet 4.6 | $3.00 | $15.00 |
| Claude Opus 4.6 | $5.00 | $25.00 |
| codex-mini(Codex CLI用) | $1.50 | $6.00 |
API従量課金で見ると、Codexのcodex-miniはClaude Sonnetの半額以下で使える。ただし、モデルの性能も異なるので単純な価格比較だけでは判断できない。次のセクションで性能を見てみよう。
料金の全体像はClaude vs ChatGPT 料金比較記事で詳しくまとめている。
3. 性能(ベンチマーク)を比較する
AIコーディングツールの性能を測る指標として、業界で広く使われているSWE-benchがある(データはSWE-bench公式リーダーボードおよび各社公式ブログより)。
「SWE-benchとは?」 実際のオープンソースプロジェクトから集めた「バグ修正タスク」をAIに解かせて、正しく修正できた割合を測るベンチマーク。スコアが高いほど、実践的なコーディング能力が高いとされる。
| モデル | SWE-bench Verified |
|---|---|
| Claude Opus 4.6 | 80.8% |
| Claude Sonnet 4.6 | 79.6% |
| GPT-5.4(Codex最新) | 78.2% |
| GPT-5.3-Codex | 78.0% |
2026年3月時点では、Claude Opus 4.6が80.8%でトップ。ただし差は数ポイントであり、実際の開発作業ではこの差を体感できないことも多い。
注意点として、OpenAI自身がSWE-bench Verifiedの信頼性に疑問を呈しており(テストデータの汚染問題)、より難易度の高いSWE-bench Proを推奨している。SWE-bench Proでは GPT-5.4が57.7%を記録しているが、Claude側の同条件スコアは公開情報が限られるため単純比較は難しい。
ベンチマークはあくまで参考値であり、「あなたのプロジェクトでどちらが使いやすいか」は実際に試してみるのが一番確実だ。
4. 機能の違いを比較する
両ツールの主要な機能を比較してみよう。
| 機能 | Claude Code | Codex |
|---|---|---|
| ファイル読み書き | ✅ | ✅ |
| コマンド実行 | ✅ | ✅ |
| Git操作・PR作成 | ✅ | ✅ |
| 画像の読み取り | ✅ | ✅ |
| 並列エージェント | ✅ サブエージェント | ✅ サブエージェント |
| 外部ツール連携(MCP) | ✅ | ✅ |
| IDE連携 | VS Code・JetBrains | VS Code・Cursor |
| クラウド非同期実行 | ❌ | ✅(Codex Cloud) |
| PC画面の操作 | ✅(Computer Use) | ❌ |
基本機能はほぼ同じだ。差が出るのは以下の2点。
Codexだけの機能:クラウド非同期実行
Codexには、ChatGPTの画面からタスクを投げてクラウド上で非同期に処理させる「Codex Cloud」モードがある。タスクを投げたら完了を待たずに別の作業ができる。複数タスクの同時処理も可能で、7時間以上かかる長時間タスクにも対応する。
Claude Codeにはこのモードがない。ターミナルでリアルタイムに対話しながら進める。その分、途中で方針を変えたり、細かい修正指示を出したりするのがスムーズだ。
Claude Codeだけの機能:Computer Use
Claude CodeにはComputer Useという独自機能がある。PCのブラウザやアプリを直接操作できる機能で、「コードを修正→ブラウザで結果を確認→問題があればさらに修正」という一連の作業をAIだけで完結させられる。Codexにはこの機能がない。
プロジェクト設定ファイル:CLAUDE.md vs AGENTS.md
どちらのツールも、プロジェクトのルート(一番上のフォルダ)に設定ファイルを置くことで、AIにプロジェクト固有のルールを伝えられる。
- Claude Code →
CLAUDE.md:コーディング規約、ビルドコマンド、アーキテクチャの方針などを書く。セッション間で引き継がれるAIへの「引き継ぎメモ」 - Codex →
AGENTS.md:同じ発想のファイル。こちらはLinux Foundation傘下のAgentic AI Foundationがオープン標準として策定しており、Codex以外のツール(Google Jules、Cursor等)でも使える
5. それぞれの得意・不得意
Claude Codeが得意なこと
- 大規模なリファクタリング:数十ファイルにまたがるコード変更をリアルタイムで見ながら進められる。途中で「やっぱりこの方針で」と方向転換もすぐできる
- ローカル環境を使ったテスト:あなたのPCのデータベースやDockerに直接アクセスして、実環境に近い状態でテストを回せる
- 画面の確認まで自動化:Computer Use機能でブラウザ操作もAIに任せられる。「コードを書いて→ブラウザで確認して→修正」まで一気通貫
- Windows対応:macOS・Linux・Windowsで動作する(Codex CLIのWindows対応は実験的)
Claude Codeが不得意なこと
- タスクを投げて放置、ということができない(リアルタイム対話が前提)
- 作業中はターミナルを占有する
- ソースコードは非公開(プロプライエタリ)
Codexが得意なこと
- タスクの並列処理:Codex Cloudを使えば、複数のバグ修正を同時に投げてまとめてレビューできる。「10個のバグを一気に片付けたい」場面に強い
- 非同期ワークフロー:タスクを投げたら自分は別の作業に集中できる。結果はPR(プルリクエスト)として出力される
- ChatGPTからの利用:ターミナルを使わなくても、ChatGPTの画面からコーディングタスクを依頼できる。コマンドラインに慣れていない人でも使いやすい
- CLI版がオープンソース:Apache 2.0ライセンスでソースコードが公開されており、中身を確認したりカスタマイズしたりできる
Codexが不得意なこと
- クラウド版は途中で方針を変えられない(完了後にフィードバック)
- クラウド版はローカルのデータベースやAPIキーに直接アクセスできない
- CLI版のWindows対応は実験的(WSL推奨)
- PC画面の操作機能がない
6. こんな人にはこっち ─ 使い分けガイド
ここまでの比較をもとに、場面別のおすすめを整理する。
「AIと対話しながらコードを書きたい」
→ Claude Code。「ここをこう変えて」「やっぱり別の方法で」とリアルタイムでやり取りしながら開発を進められる。大規模なリファクタリングや、複雑な設計判断を伴う作業に向いている。
「タスクを投げて、自分は別の作業をしたい」
→ Codex(Cloud版)。「この機能を実装して」「このバグを直して」とタスクを投入したら、あとは完了を待つだけ。複数タスクの同時処理もできるので、時間を効率的に使える。
「ターミナルに慣れていない」
→ Codex(Cloud版)。ChatGPTの画面から「このリポジトリのこのバグを直して」と日本語で指示するだけで使える。コマンドラインの知識は不要。
「Windowsで使いたい」
→ Claude Code。WindowsにネイティブまたはWSLで対応している。Codex CLIのWindows対応は実験的で、WSL推奨。
「API従量課金でコストを抑えたい」
→ Codex。codex-miniモデルのAPI料金はClaude Sonnetの半額以下(入力$1.50 vs $3.00/百万トークン)。ただし性能差があるので、コストと品質のバランスは実際に試して判断するのがよい。
「予算があるなら両方使う」
Claude Pro($20/月)+ ChatGPT Plus($20/月)= $40/月で両方のツールが使える。対話しながら進めたい場面ではClaude Code、独立した小タスクを大量にさばきたい場面ではCodex Cloudと使い分けるのが最も効率的だ。AIモデルの得意分野も異なるので、両方使える環境があると選択肢が広がる。
7. よくある質問
Q. GitHub Copilotとは何が違うの?
Copilotは主にエディタ内で「次の1行」を予測して補完するツール。Claude CodeやCodexはエージェント型で、「この機能を作って」と指示すれば、ファイルの作成からテスト実行、PR作成まで自律的に行う。作業の粒度がまったく違う。Copilotは「タイピングの補助」、Claude Code/Codexは「タスクの委任」というイメージだ。
Q. 機密性の高いコードを扱っても大丈夫?
どちらもビジネス/エンタープライズプランでは、会話データがAIの学習に使われない仕組みがある。Claude Codeはローカルで動作し、クラウドに送信されるのはAPI通信(AIへの質問と回答)のみ。Codex CLIも同様にローカル実行。Codex Cloudはクラウド上のコンテナで動くが、デフォルトでインターネットから隔離されている。機密性が特に高い場合はエンタープライズプランの検討をおすすめする。
Q. 無料で試す方法はある?
2026年3月時点では、Claude Code、Codexとも無料プランでは利用できない。最低でも$20/月のサブスクリプションか、APIキーの購入が必要だ。APIキー方式なら使った分だけの支払いなので、少額から試すことは可能。
Q. どちらが将来性がある?
これは筆者の見解になるが、どちらも活発にアップデートされており、機能差は急速に縮まっている。Claude CodeはClaudeのエコシステム全体との連携が強み。Codexはオープンソース戦略とChatGPTの巨大なユーザーベースが強み。「どちらか一方が消える」という状況にはなりにくく、競争が続くことで両方とも進化していくと見ている。※これは公式見解ではなく筆者の推測です。
まとめ
Claude CodeとCodexは、どちらも強力なAIコーディングツールだ。基本機能は似ているが、使い方の思想が異なる。
- Claude Code = AIとリアルタイムで対話しながら開発。大規模な変更、複雑な判断を伴う作業、画面操作の自動化が得意
- Codex = タスクを投げて任せるスタイルも可能。小タスクの並列処理、ChatGPTからの手軽な利用が得意
迷ったら、まずは$20/月のプランでどちらか一方を試してみよう。AIコーディングツールは使ってみないと自分との相性がわからない。両方試して、自分の開発スタイルに合う方をメインにするのがベストだ。
参考リンク
※ 本記事の情報は2026年3月時点のものです。料金やベンチマークスコアは変更される可能性があります。最新情報は各公式サイトをご確認ください。