このガイドでは、使用しているモデル、使用方法の計測方法、および長いセッションをコンテキストと使用制限内に保つ方法について説明します。
使用方法の計測方法
サインイン方法によって、使用方法の計測方法が決まります。それ以外のClaudeコードの動作はすべて同じです。
サインイン方法… | 取得内容 | 「上限に達した」場合の表示 |
Claude Enterpriseシート( | 組織のプランに含まれる使用量プール。ローリングウィンドウでリセットされます。 | 「上限に達しました。時刻にリセットされます」というメッセージ。 |
APIキー(Console、Bedrock、またはVertex) | 従量課金制。トークンごとにそのクラウドまたはConsoleアカウントに請求されます。 | ハードストップなし。アカウントは使用した分に対して請求されます。 |
Enterpriseシートでサインインしている場合、通常は上限に達するまでトークンについて考える必要はありません。APIキーを使用している場合、/costコマンドで現在のセッションの実行コストが表示されます。
モデルの選択
/modelをいつでも実行して、アカウントで利用可能なモデルを確認し、モデルを切り替えることができます。大まかなガイドとしては以下の通りです:
Sonnetはデフォルトであり、大多数のコーディング作業に適しています。高速で、機能が豊富で、コスト効率的です。
Opusは、大規模なクロスカッティングリファクタリング、難しいデバッグ、アーキテクチャの決定など、より難しい問題に対してより深い推論を提供します。クォータをより多く使用するため、デフォルトで有効にしておくのではなく、必要な場合に切り替えてください。
Haikuは最速で最も安価なオプションで、クイックルックアップ、シンプルな編集、または大量のスクリプト実行に適しています。
セッション中にモデルを変更しても、会話は失われません。一般的なパターンはOpusで計画を立て、Sonnetで実行することです。
注:正確なモデル名、バージョン、および利用可能性は時間とともに変わります。/modelコマンドは常にアカウントの信頼できる情報源です。
実際にトークンを消費するもの
毎ターン、モデルに3つのものが送信されます:
これまでの会話—このセッション内のすべての以前のメッセージ。
プロジェクトコンテキスト—
CLAUDE.mdおよびClaudeが読んだファイル。新しいプロンプト。
このうち、最初の項目が最も速く増加します。Claudeが20個のファイルを読み、15個の差分を生成した長いデバッグセッションは、その後のすべてのメッセージでそのすべてを保持しています。これがコストとコンテキスト制限の両方の発生源です。
コンテキストウィンドウの管理
コンテキストウィンドウは、モデルが一度に考慮できるテキストの最大量です。Claude Codeはそれがどの程度満杯であるかのライブインジケータを表示します。満杯になると、Claudeは会話の最も古い部分をもはや明確に見ることができず、品質が低下します。
2つのコマンドがそれを制御下に保ちます:
/clearは会話をクリアして新たに開始します。CLAUDE.mdとプロジェクトファイルは利用可能なままです。チャット履歴のみが削除されます。タスクを切り替えるときはいつでもこれを使用してください。品質とコストの両方に対して最も効果的なレバーです。/compactは、これまでの会話を短い要約に要約し、スペースを解放しながら本質的なコンテキストを保持します。タスクの途中で続行する必要がある場合に使用します。Claude Codeは制限に近づくと自動的にコンパクト化するため、ハードウォールにぶつかることはめったにありません。
経験則:新しいタスクを開始するときは/clearを使用し、長いタスクを続行するときは/compactを使用します。
使用量を最大限に伸ばす5つの習慣
ほぼすべての「昼までに上限を使い切った」というレポートは、これら5つのうちの1つに遡ります。
1. タスク間でクリアする
すべての以前のメッセージは毎ターン再送信されるため、3つの無関係な問題を通じて迷走したセッションは、新しいメッセージのたびにすべての3つに対して支払います。実際には:ログインリダイレクトのデバッグを終了し、データベースマイグレーションを作成したいとします。最初に/clearを実行します。簡単なテスト:次のプロンプトが真新しいターミナルで完全に意味をなす場合、送信する前にクリアします。CLAUDE.mdとプロジェクトファイルはそのままです。チャット履歴のみが削除されます。1つの警告:/clearは元に戻せません。履歴から何かが必要な場合は、最初にそれをコピーするか、代わりに/compactを実行してください。これはすべてをクリアするのではなく、要約を保持します。
2. モデルをジョブに合わせる
Opusはターンあたりの費用がSonnetの数倍であり、SonnetはHaikuの数倍です。日常的な作業にOpusを費やすことは、日次制限を消費する最速の方法です。合理的なデフォルト:ほとんどのコーディング(機能、テスト、既知のバグ、リファクタリング)にはSonnet。本当に行き詰まっているか、変更が広い場合(難しいデバッグ、クロスカッティングリファクタリング、アーキテクチャの呼び出し)にはOpus。クイック機械的作業(名前変更、ログ行、正規表現の説明、ボイラープレート)にはHaiku。
3. ファイルを貼り付けるのではなく、ファイルを指す
貼り付けたものはすべてコンテキストに完全に残り、セッションの残りの間ずっと残ります。パスでファイルを参照すると、Claudeは選択的に読み取り、気になる部分に焦点を当てることができます。実際には:auth.tsを貼り付ける代わりに、「@src/auth.tsのvalidateToken関数を見てください」と書きます。ログとスタックトレースの場合は、貼り付ける前に関連する20〜30行に削減します。ロックファイル、ビルドログ、データダンプなど、大きなもの(ロックファイル、ビルドログ、データダンプ)の場合は、ディスクに置いてパスを参照します。
4. CLAUDE.mdをリーンに保つ
このファイルはすべてのターンの前に付加されるため、そのコストは送信するメッセージの数によって乗算されます。40ターンのセッション全体で300行のCLAUDE.mdは、作業を行う前に支払った12,000行の入力です。ルール:2ストライク、1画面。同じことについてClaudeを修正する必要がある2回目の場合にのみメモを追加します(初回の問題は通常1回限りです)。ファイルが約80〜100行の単一画面を超えて成長しないようにしてください。新しいものが入る必要があり、スペースがない場合は、古いものが出る必要があります。更新するタイミング:同じことについてClaudeを2回修正する必要があったセッションの直後。それは修正が新鮮で、書き留めるのに1分かかるときです。数週間ごとに、ファイル全体を読み、もはや真実ではないか、その目的を覚えていないものを削除します。古いメモは、Claudeを積極的に誤った方向に導くため、欠落しているメモよりも悪いです。
5. 大きな変更の前に計画を求める
計画には数百トークンの費用がかかります。間違った400行の差分を元に戻して再生成するには数千トークンかかり、2倍、さらに何が間違ったかを説明するのに費やされたターンがあります。実際には:2〜3個以上のファイルに触れるものについては、プランモードに切り替えるか、単に「何かを変更する前に、タッチするファイルと各ファイルで行うことをリストアップしてください」と尋ねます。リストを読み、平文で修正します(「legacy/をスキップし、まだテストに触れないでください」)、その後実行させます。
プロのヒント:Opusで計画を立て、Sonnetで実行します。Opusの最高価値の使用は、計画自体を書くことです。ここで、より深い推論が実際に報われます。良い計画が存在すると、実行はほぼ機械的であり、Sonnetはコストの一部でそれを処理します。ワークフロー:/model opus、計画を求める、それを確認して修正する、その後/model sonnetと「上記の計画を実行します」。モデルを切り替えても会話はクリアされないため、Sonnetはまだ、Opusが生成したすべてを見ています。
制限に達したときの対処方法
Enterpriseシートユーザー:メッセージはウィンドウがいつリセットされるかを示します。その間、
/modelでより軽いモデルに切り替えるか、組織が許可している場合は、一時的にAPIキーにフォールバックできます。APIキーユーザー:使用量の上限はありませんが、支出が懸念される場合は
/costとConsoleまたはクラウドプロバイダーのダッシュボードを確認してください。予期しない高い数値は、ほぼ常にクリアされたことのない非常に長いセッションに遡ります。コンテキストウィンドウが満杯(使用制限とは異なります):
/compactを実行して続行するか、古い履歴がもはや必要ない場合は/clearを実行します。
クイックリファレンス
コマンド | 機能 |
| 利用可能なモデルを表示して切り替えます。 |
| このセッションのトークンとドル使用量を表示します(APIの請求)。 |
| 新しい会話を開始します(プロジェクトメモリは残ります)。 |
| 履歴を要約してコンテキストを解放します。 |
| 現在コンテキストに読み込まれているものを検査します。 |
