Claude Codeを使い始めると、多くの人が最初に驚くのがトークン消費の速さです。「ちょっとファイルを編集しただけなのに、もう上限?」という経験はありませんか?

この記事では、Claude Codeのトークン消費が多い仕組みを理解した上で、10の実践的な節約テクニックと、上限に達した場合の挙動・追加料金について解説します。

1. Claude Codeはなぜトークンを大量消費するのか

Claude Codeは通常のチャットとは違い、エージェント型のシステムです。ユーザーの1回の指示に対して、内部的に何度もAPIを呼び出してタスクを完了させます。

Claude Codeのトークン消費の仕組み:1回の指示で複数のAPI呼び出しが発生する図

トークン消費が多い具体的な理由

  • 毎回の会話にシステムプロンプト+会話履歴が含まれる:メッセージを送るたびに、過去の会話全体が再送信されるため、会話が長くなるほどトークン消費が加速する
  • ファイル読み込みがコンテキストに入る:コードを編集する際、対象ファイルの内容がコンテキストに取り込まれる。大きなファイルほどトークンを消費する
  • ツール呼び出しが連鎖する:1回の指示で、ファイル検索→読み込み→編集→確認という複数のツール呼び出しが内部的に発生する(Anthropicの公式情報によると、1回のコマンドで8〜12回のAPI呼び出しが生じることもある)
  • 思考トークン(thinking tokens)が出力として課金される:Claude Codeが内部で「考える」プロセスにもトークンが消費される

Claude Codeの各モードの違いについては、Claudeの「チャット・Cowork・コード」の違いの記事で解説しています。

2. プラン別の利用上限と料金体系

Anthropicは具体的なトークン数を公開していませんが、各プランの位置づけと料金は以下の通りです。

Claude Codeのプラン別料金比較:Pro、Max 5x、Max 20x、APIの特徴と価格
プラン月額利用上限特徴
Pro$20基本枠(5時間ローリングウィンドウ)通常のチャットとClaude Code共通の枠
Max 5x$100Proの5倍Claude Code中心の利用者向け
Max 20x$200Proの20倍ヘビーユーザー・業務利用向け
API(従量課金)使った分だけレートリミットありSonnet: $3/$15、Opus: $15/$75(MTok単価)

注意:ProプランとMax間でトークン枠は共有

Claude Code と通常のClaudeチャットは同じトークン枠を共有しています。Claude Codeで大量にトークンを消費すると、通常のチャットも制限されます。

料金の詳細比較はClaude vs ChatGPT 料金比較の記事をご覧ください。

3. トークン節約テクニック10選

以下のテクニックを実践することで、トークン消費を大幅に削減できます。

トークン節約テクニック10選のサマリー図

テクニック1:/clear でこまめにコンテキストをリセット

異なるタスクに移るときは /clear を実行して会話をリセットしましょう。古い会話履歴が残っていると、毎回のメッセージで不要なトークンが再送信されます。

# 認証機能の作業が終わったら
/clear

# 次のタスクを開始
「決済機能を追加してください」

テクニック2:/compact で会話を圧縮する

長い会話を途中で圧縮できます。カスタム指示を添えると、重要な部分だけを残せます。

# 基本的な圧縮
/compact

# カスタム指示付きの圧縮
/compact コード変更点とAPI仕様だけ残して

テクニック3:--include でコンテキストを絞る

Claude Codeの起動時に --include オプションで対象ファイルを絞ると、不要なファイルの読み込みを防げます。Anthropicの公式ドキュメントによると、これだけで入力トークンを50〜80%削減できる場合があります。

# プロジェクト全体ではなく、特定のディレクトリだけを対象に
claude --include "src/components/**/*.tsx"

# 複数のパターンを指定
claude --include "src/api/**" --include "src/types/**"

テクニック4:タスクに応じてモデルを切り替える

すべてのタスクにOpus(最高性能モデル)を使う必要はありません。Sonnetは入出力ともに約5分の1のコストで、日常的なコーディングには十分な性能です。

# 日常的なコーディングにはSonnetを使用
/model sonnet

# 設計判断や複雑なリファクタリングにはOpusを使用
/model opus

テクニック5:出力を短く指示する

AIの応答が長いほど出力トークンが増えます。「コードだけ」「一行で回答して」といった指示で無駄な出力を減らせます。

❌ 「この関数を修正してください」
→ AIが長い説明+コード+補足を生成(大量の出力トークン)

✅ 「この関数を修正して。説明不要、コードだけ出して」
→ コードのみ生成(出力トークン大幅削減)

テクニック6:思考トークンを制限する

Claude Codeは内部で「考える」プロセスにもトークンを消費します。単純なタスクでは思考を制限することでコストを削減できます。

# 簡単なタスクにはeffortを下げる
/effort low

テクニック7:CLAUDE.mdを簡潔に保つ

CLAUDE.md(プロジェクトの設定ファイル)はメッセージごとに毎回読み込まれます。不要な情報を詰め込みすぎると、毎回のトークン消費が増えます。

CLAUDE.mdのコツ

プロジェクトのルール・コマンド・重要な規約だけを記載し、長い説明やドキュメントは別ファイルに分離する。目安として200行以内に収めましょう。

テクニック8:サブエージェントを活用する

テスト実行やログ解析など、大量の出力が発生するタスクはサブエージェントに委任しましょう。サブエージェントの詳細な出力はメインのコンテキストに含まれないため、トークンを節約できます。

テクニック9:仕様を先に渡して手戻りを減らす

「とりあえず作って→修正して→やっぱり変えて」という会話はトークンの浪費です。最初に明確な仕様を渡すことで、手戻りを防ぎトークン消費を直線的に抑えられます。

❌ 会話パターン(トークン消費が指数的に増加):
「ログイン機能を作って」→「バリデーション追加して」
→「やっぱりメール認証にして」→「UIも変えて」

✅ 仕様先渡しパターン(トークン消費が直線的):
「以下の仕様でログイン機能を作ってください:
- メールアドレス+パスワード認証
- メールアドレスのバリデーション(形式チェック+重複チェック)
- パスワード要件:8文字以上、英数字混合
- ログインフォームのUI:中央配置、カード型」

プロンプトの書き方については、AIに渡すプロンプトのコツの記事で詳しく解説しています。

テクニック10:ファイル形式に注意する

PDFやExcelファイルは、テキスト抽出や画像変換のために大量のトークンを消費します。可能であれば、事前にテキストやCSVに変換してから渡しましょう。

4. 上限に達したらどうなる?

トークンの利用上限に達した場合、プランによって挙動が異なります。

サブスクリプションプラン(Pro / Max)の場合

  • 5時間のローリングウィンドウで利用量が管理されている。上限に達すると一時的に利用できなくなる
  • 永久にブロックされるのではなく、時間経過とともに枠が回復する
  • 追加料金は発生しない(定額制のため)
  • ただし、上限到達が頻発する場合は上位プランへの変更を検討すべき

APIプラン(従量課金)の場合

  • レートリミット(1分あたり・1日あたりの制限)に達すると429エラーが返される
  • 利用量の上限はないが、Anthropicが設定するレートリミットに従う
  • 使った分だけ課金されるため、青天井にならないよう予算管理が重要

API利用時の注意

API経由でClaude Codeを使う場合、1日あたりの開発者コストは平均約$6というデータがAnthropicから公開されています(90%のユーザーが$12/日以下)。ただし、大規模プロジェクトでは大幅に超える可能性があるため、必ず利用量の監視を設定しましょう。

5. API利用時の従量課金の仕組み

APIプランを使う場合のトークン単価は以下の通りです(2026年4月時点)。

モデル入力トークン出力トークンプロンプトキャッシュ
Claude Sonnet 4.6$3 / MTok$15 / MTok入力の10%
Claude Opus 4.6$15 / MTok$75 / MTok入力の10%

※ MTok = 100万トークン

プロンプトキャッシュとは

Anthropicはプロンプトキャッシュ機能を提供しており、同じコンテキスト(システムプロンプトや直前の会話)を再利用する場合、入力トークンのコストが10%に削減されます。

ただし、キャッシュの有効期限は約5分です。つまり、5分以上作業を中断するとキャッシュが失効し、次のメッセージでコンテキスト全体が再課金されます。

キャッシュを活かすコツ

作業を中断する前に /compact を実行しておくと、再開時のコンテキストが小さくなり、キャッシュ失効の影響を最小限に抑えられます。

6. まとめ

Key Takeaways

  • Claude Codeは1回の指示で複数のAPI呼び出しが発生するため、通常のチャットよりトークン消費が多い
  • 節約の基本は/clear、/compact、--includeの3つ
  • 日常のコーディングにはSonnet(Opusの約1/5のコスト)で十分
  • サブスクプランは定額制で追加料金なし。上限に達すると一時的に利用不可になるが、ローリングウィンドウで回復する
  • API利用時は従量課金。プロンプトキャッシュを活用し、利用量を監視することが重要

FAQ

ProプランでClaude Codeを使うのは現実的ですか?

軽い作業であれば可能ですが、本格的な開発には上限に頻繁に達します。Claude Codeを日常的に使うなら、最低でもMax 5x($100/月)を推奨します。Proプランの枠は通常のチャットと共有されるため、Claude Codeだけであっという間に消費されてしまいます。

トークン消費量を確認する方法はありますか?

Claude Code上で /cost コマンドを使うと、現在のセッションのトークン消費量と推定コストを確認できます。API利用の場合は、Anthropicのダッシュボード(console.anthropic.com)で詳細な利用量を確認できます。

上限に達したとき、上位プランに切り替えるとすぐ使えますか?

はい、プランのアップグレードは即座に反映されます。ProからMax 5xへの変更、Max 5xからMax 20xへの変更はいつでも可能で、変更後すぐに新しい上限が適用されます。

チームや企業で使う場合の料金体系はどうなりますか?

TeamプランはStandard($25/席/月)とPremium($100/席/月、Claude Code含む)の2種類があります。Enterpriseプランは年間契約のシートライセンスに加えてAPI利用分の課金があり、最低50席からとなります。大規模利用の場合はAnthropicに直接問い合わせて見積もりを取ることをおすすめします。