目次
Claude Codeを使い始めると、多くの人が最初に驚くのがトークン消費の速さです。「ちょっとファイルを編集しただけなのに、もう上限?」という経験はありませんか?
この記事では、Claude Codeのトークン消費が多い仕組みを理解した上で、10の実践的な節約テクニックと、上限に達した場合の挙動・追加料金について解説します。
1. Claude Codeはなぜトークンを大量消費するのか
Claude Codeは通常のチャットとは違い、エージェント型のシステムです。ユーザーの1回の指示に対して、内部的に何度もAPIを呼び出してタスクを完了させます。
トークン消費が多い具体的な理由
- 毎回の会話にシステムプロンプト+会話履歴が含まれる:メッセージを送るたびに、過去の会話全体が再送信されるため、会話が長くなるほどトークン消費が加速する
- ファイル読み込みがコンテキストに入る:コードを編集する際、対象ファイルの内容がコンテキストに取り込まれる。大きなファイルほどトークンを消費する
- ツール呼び出しが連鎖する:1回の指示で、ファイル検索→読み込み→編集→確認という複数のツール呼び出しが内部的に発生する(Anthropicの公式情報によると、1回のコマンドで8〜12回のAPI呼び出しが生じることもある)
- 思考トークン(thinking tokens)が出力として課金される:Claude Codeが内部で「考える」プロセスにもトークンが消費される
Claude Codeの各モードの違いについては、Claudeの「チャット・Cowork・コード」の違いの記事で解説しています。
2. プラン別の利用上限と料金体系
Anthropicは具体的なトークン数を公開していませんが、各プランの位置づけと料金は以下の通りです。
| プラン | 月額 | 利用上限 | 特徴 |
|---|---|---|---|
| Pro | $20 | 基本枠(5時間ローリングウィンドウ) | 通常のチャットとClaude Code共通の枠 |
| Max 5x | $100 | Proの5倍 | Claude Code中心の利用者向け |
| Max 20x | $200 | Proの20倍 | ヘビーユーザー・業務利用向け |
| API(従量課金) | 使った分だけ | レートリミットあり | Sonnet: $3/$15、Opus: $15/$75(MTok単価) |
注意:ProプランとMax間でトークン枠は共有
Claude Code と通常のClaudeチャットは同じトークン枠を共有しています。Claude Codeで大量にトークンを消費すると、通常のチャットも制限されます。
料金の詳細比較はClaude vs ChatGPT 料金比較の記事をご覧ください。
3. トークン節約テクニック10選
以下のテクニックを実践することで、トークン消費を大幅に削減できます。
テクニック1:/clear でこまめにコンテキストをリセット
異なるタスクに移るときは /clear を実行して会話をリセットしましょう。古い会話履歴が残っていると、毎回のメッセージで不要なトークンが再送信されます。
# 認証機能の作業が終わったら
/clear
# 次のタスクを開始
「決済機能を追加してください」
テクニック2:/compact で会話を圧縮する
長い会話を途中で圧縮できます。カスタム指示を添えると、重要な部分だけを残せます。
# 基本的な圧縮
/compact
# カスタム指示付きの圧縮
/compact コード変更点とAPI仕様だけ残して
テクニック3:--include でコンテキストを絞る
Claude Codeの起動時に --include オプションで対象ファイルを絞ると、不要なファイルの読み込みを防げます。Anthropicの公式ドキュメントによると、これだけで入力トークンを50〜80%削減できる場合があります。
# プロジェクト全体ではなく、特定のディレクトリだけを対象に
claude --include "src/components/**/*.tsx"
# 複数のパターンを指定
claude --include "src/api/**" --include "src/types/**"
テクニック4:タスクに応じてモデルを切り替える
すべてのタスクにOpus(最高性能モデル)を使う必要はありません。Sonnetは入出力ともに約5分の1のコストで、日常的なコーディングには十分な性能です。
# 日常的なコーディングにはSonnetを使用
/model sonnet
# 設計判断や複雑なリファクタリングにはOpusを使用
/model opus
テクニック5:出力を短く指示する
AIの応答が長いほど出力トークンが増えます。「コードだけ」「一行で回答して」といった指示で無駄な出力を減らせます。
❌ 「この関数を修正してください」
→ AIが長い説明+コード+補足を生成(大量の出力トークン)
✅ 「この関数を修正して。説明不要、コードだけ出して」
→ コードのみ生成(出力トークン大幅削減)
テクニック6:思考トークンを制限する
Claude Codeは内部で「考える」プロセスにもトークンを消費します。単純なタスクでは思考を制限することでコストを削減できます。
# 簡単なタスクにはeffortを下げる
/effort low
テクニック7:CLAUDE.mdを簡潔に保つ
CLAUDE.md(プロジェクトの設定ファイル)はメッセージごとに毎回読み込まれます。不要な情報を詰め込みすぎると、毎回のトークン消費が増えます。
CLAUDE.mdのコツ
プロジェクトのルール・コマンド・重要な規約だけを記載し、長い説明やドキュメントは別ファイルに分離する。目安として200行以内に収めましょう。
テクニック8:サブエージェントを活用する
テスト実行やログ解析など、大量の出力が発生するタスクはサブエージェントに委任しましょう。サブエージェントの詳細な出力はメインのコンテキストに含まれないため、トークンを節約できます。
テクニック9:仕様を先に渡して手戻りを減らす
「とりあえず作って→修正して→やっぱり変えて」という会話はトークンの浪費です。最初に明確な仕様を渡すことで、手戻りを防ぎトークン消費を直線的に抑えられます。
❌ 会話パターン(トークン消費が指数的に増加):
「ログイン機能を作って」→「バリデーション追加して」
→「やっぱりメール認証にして」→「UIも変えて」
✅ 仕様先渡しパターン(トークン消費が直線的):
「以下の仕様でログイン機能を作ってください:
- メールアドレス+パスワード認証
- メールアドレスのバリデーション(形式チェック+重複チェック)
- パスワード要件:8文字以上、英数字混合
- ログインフォームのUI:中央配置、カード型」
プロンプトの書き方については、AIに渡すプロンプトのコツの記事で詳しく解説しています。
テクニック10:ファイル形式に注意する
PDFやExcelファイルは、テキスト抽出や画像変換のために大量のトークンを消費します。可能であれば、事前にテキストやCSVに変換してから渡しましょう。
4. 上限に達したらどうなる?
トークンの利用上限に達した場合、プランによって挙動が異なります。
サブスクリプションプラン(Pro / Max)の場合
- 5時間のローリングウィンドウで利用量が管理されている。上限に達すると一時的に利用できなくなる
- 永久にブロックされるのではなく、時間経過とともに枠が回復する
- 追加料金は発生しない(定額制のため)
- ただし、上限到達が頻発する場合は上位プランへの変更を検討すべき
APIプラン(従量課金)の場合
- レートリミット(1分あたり・1日あたりの制限)に達すると429エラーが返される
- 利用量の上限はないが、Anthropicが設定するレートリミットに従う
- 使った分だけ課金されるため、青天井にならないよう予算管理が重要
API利用時の注意
API経由でClaude Codeを使う場合、1日あたりの開発者コストは平均約$6というデータがAnthropicから公開されています(90%のユーザーが$12/日以下)。ただし、大規模プロジェクトでは大幅に超える可能性があるため、必ず利用量の監視を設定しましょう。
5. API利用時の従量課金の仕組み
APIプランを使う場合のトークン単価は以下の通りです(2026年4月時点)。
| モデル | 入力トークン | 出力トークン | プロンプトキャッシュ |
|---|---|---|---|
| Claude Sonnet 4.6 | $3 / MTok | $15 / MTok | 入力の10% |
| Claude Opus 4.6 | $15 / MTok | $75 / MTok | 入力の10% |
※ MTok = 100万トークン
プロンプトキャッシュとは
Anthropicはプロンプトキャッシュ機能を提供しており、同じコンテキスト(システムプロンプトや直前の会話)を再利用する場合、入力トークンのコストが10%に削減されます。
ただし、キャッシュの有効期限は約5分です。つまり、5分以上作業を中断するとキャッシュが失効し、次のメッセージでコンテキスト全体が再課金されます。
キャッシュを活かすコツ
作業を中断する前に /compact を実行しておくと、再開時のコンテキストが小さくなり、キャッシュ失効の影響を最小限に抑えられます。
6. まとめ
Key Takeaways
- Claude Codeは1回の指示で複数のAPI呼び出しが発生するため、通常のチャットよりトークン消費が多い
- 節約の基本は/clear、/compact、--includeの3つ
- 日常のコーディングにはSonnet(Opusの約1/5のコスト)で十分
- サブスクプランは定額制で追加料金なし。上限に達すると一時的に利用不可になるが、ローリングウィンドウで回復する
- API利用時は従量課金。プロンプトキャッシュを活用し、利用量を監視することが重要
FAQ
ProプランでClaude Codeを使うのは現実的ですか?
軽い作業であれば可能ですが、本格的な開発には上限に頻繁に達します。Claude Codeを日常的に使うなら、最低でもMax 5x($100/月)を推奨します。Proプランの枠は通常のチャットと共有されるため、Claude Codeだけであっという間に消費されてしまいます。
トークン消費量を確認する方法はありますか?
Claude Code上で /cost コマンドを使うと、現在のセッションのトークン消費量と推定コストを確認できます。API利用の場合は、Anthropicのダッシュボード(console.anthropic.com)で詳細な利用量を確認できます。
上限に達したとき、上位プランに切り替えるとすぐ使えますか?
はい、プランのアップグレードは即座に反映されます。ProからMax 5xへの変更、Max 5xからMax 20xへの変更はいつでも可能で、変更後すぐに新しい上限が適用されます。
チームや企業で使う場合の料金体系はどうなりますか?
TeamプランはStandard($25/席/月)とPremium($100/席/月、Claude Code含む)の2種類があります。Enterpriseプランは年間契約のシートライセンスに加えてAPI利用分の課金があり、最低50席からとなります。大規模利用の場合はAnthropicに直接問い合わせて見積もりを取ることをおすすめします。