Claude Codeのモデル、使用方法、および制限

このガイドでは、使用しているモデル、使用方法の計測方法、および長いセッションをコンテキストと使用制限内に保つ方法について説明します。

使用方法の計測方法

サインイン方法によって、使用方法の計測方法が決まります。それ以外のClaudeコードの動作は、すべて同じです。

サインイン方法…	取得内容	「上限に達した」場合の表示
Claude Enterpriseシート（`/login`経由）	組織のプランに含まれる使用量プール。ローリングウィンドウでリセットされます。	「上限に達しました。時刻にリセットされます」というメッセージ。
APIキー（Console、Bedrock、Vertex、またはMicrosoft Foundry）	従量課金制。トークンごとにそのクラウドまたはConsoleアカウントに請求されます。	ハードストップなし。アカウントは使用した分に対して請求されます。

Enterpriseシートでサインインしている場合、通常は上限に達するまでトークンについて考える必要はありません。APIキーを使用している場合、/costコマンドで現在のセッションの実行コストが表示されます。

モデルの選択

いつでも/modelを実行して、アカウントで利用可能なモデルを確認し、モデルを切り替えることができます。大まかなガイドとしては以下の通りです。

Sonnetはデフォルトであり、大多数のコーディング作業に適しています。高速で、機能が豊富で、コスト効率的です。
Opusは、大規模なクロスカッティングリファクタリング、難しいデバッグ、アーキテクチャの決定など、難しい問題に対してより深い推論を提供します。クォータをより多く使用するため、デフォルトで有効にしておくのではなく、必要な場合に切り替えてください。
Haikuは最速で最も安価なオプションであり、クイックルックアップ、シンプルな編集、または大量のスクリプト実行に適しています。

セッション中にモデルを変更しても、会話は失われません。一般的なパターンはOpusで計画し、Sonnetで実行することです。

注：正確なモデル名、バージョン、および利用可能性は時間とともに変わります。/modelコマンドは常にアカウントの信頼できる情報源です。

実際にトークンを消費するもの

各ターンでモデルに3つのものが送信されます。

これまでの会話—このセッションの以前のすべてのメッセージ。
プロジェクトコンテキスト—CLAUDE.mdおよびClaudeが読んだファイル。
新しいプロンプト。

このうち、最初の項目が最も速く増加します。Claudeが20個のファイルを読み、15個の差分を生成した長いデバッグセッションは、その後のすべてのメッセージでそのすべてを保持しています。これがコストとコンテキスト制限の両方の発生源です。

コンテキストウィンドウの管理

コンテキストウィンドウは、モデルが一度に考慮できるテキストの最大量です。Claude Codeは、それがどの程度満杯であるかのライブインジケータを表示します。満杯になると、Claudeは会話の最も古い部分をもはや明確に見ることができず、品質が低下します。

2つのコマンドがそれを制御下に保ちます。

/clearは会話をクリアして新たに開始します。CLAUDE.mdとプロジェクトファイルは利用可能なままです。チャット履歴のみが削除されます。タスクを切り替えるときはいつでもこれを使用してください。品質とコストの両方に対して最も効果的なレバーです。
/compactは、これまでの会話を短い要約に要約し、スペースを解放しながら本質的なコンテキストを保持します。タスクの途中で続行する必要がある場合に使用してください。Claude Codeは制限に近づくと自動的にコンパクト化するため、ハードウォールにぶつかることはめったにありません。

経験則：新しいタスクを開始するときは/clearを使用し、長いタスクを続行するときは/compactを使用してください。

使用量を最大限に伸ばす5つの習慣

ほぼすべての「昼までに上限を使い切った」というレポートは、これら5つのうちの1つに遡ります。

1. タスク間でクリアする

以前のすべてのメッセージは各ターンで再送信されるため、3つの無関係な問題を通じて迷走したセッションは、新しいメッセージのたびにすべての3つに対して支払います。

実際には：ログインリダイレクトのデバッグを終了し、データベースマイグレーションを作成したいとします。最初に/clearを実行してください。簡単なテスト：次のプロンプトが真新しいターミナルで完全に意味をなす場合は、送信する前にクリアしてください。CLAUDE.mdとプロジェクトファイルはそのままです。チャット履歴のみが削除されます。

1つの警告：/clearは元に戻すことができません。履歴から何かが必要になる可能性がある場合は、最初にそれをコピーするか、代わりに/compactを実行してください。これはすべてをクリアするのではなく、要約を保持します。

2. モデルをジョブに合わせる

Opusはターンあたりの費用がSonnetの数倍であり、SonnetはHaikuの数倍です。日常的な作業にOpusを費やすことは、日次制限を消費する最速の方法です。

合理的なデフォルト：ほとんどのコーディング（機能、テスト、既知のバグ、リファクタリング）にはSonnet。本当に行き詰まっているか、変更が広い場合（難しいデバッグ、クロスカッティングリファクタリング、アーキテクチャの呼び出し）にはOpus。クイック機械的作業（名前変更、ログ行、正規表現の説明、ボイラープレート）にはHaiku。

3. ファイルを貼り付ける代わりにポイントする

貼り付けたものはすべてコンテキストに完全に残ります。パスでファイルを参照すると、Claudeは選択的に読み取り、気になる部分に焦点を当てることができます。

実際には：auth.tsを貼り付ける代わりに、src/auth.tsのvalidateToken関数を見てください。パスを指定するとClaudeが開いて選択的に読み取ることができます。（@プレフィックスはファイル全体とそのCLAUDE.mdツリーをコンテキストに挿入するため、トークンを保存しようとしている場合は、ベアパスを使用してください。）ログとスタックトレースの場合は、貼り付ける前に関連する20〜30行にトリミングしてください。ロックファイル、ビルドログ、データダンプなど、大きなもの（ロックファイル、ビルドログ、データダンプ）の場合は、ディスクに配置してパスを参照してください。

4. CLAUDE.mdをリーンに保つ

このファイルはすべてのターンの前に付加されます。プロンプトキャッシングは、最初の後のターンがはるかに安いキャッシュ読み取りレートで請求されることを意味するため、ドル費用は生のライン数よりも低くなりますが、それでもすべてのメッセージでコンテキストウィンドウスペースを占有します。

ルール：2ストライク、タイトに保つ。同じことについてClaudeを修正する必要がある2回目の時点でのみメモを追加してください（初回の問題は通常1回限りです）。ファイルを約200行以下に保ってください。何か新しいものが入る必要があり、スペースがない場合は、何か古いものが出ていく必要があります。

更新するタイミング：同じことについてClaudeを2回修正する必要があったセッションの直後。その時点で修正は新鮮で、書き留めるのに1分かかります。数週間ごとに、ファイル全体を読み、もはや真実ではないか、その目的を思い出せないものを削除してください。古いメモは、Claudeを積極的に誤った方向に導くため、欠落しているメモよりも悪いです。

5. 大きな変更の前に計画を求める

計画には数百トークンの費用がかかります。間違った400行の差分を元に戻して再生成するには数千トークンの費用がかかり、2倍、さらに何が間違ったかを説明するのに費やされたターンがあります。実際には：2〜3個以上のファイルに触れるものについては、プランモードに切り替えるか、単に「何かを変更する前に、タッチするファイルと各ファイルで何をするかをリストアップしてください」と尋ねてください。リストを読み、プレーンイングリッシュで修正してください（「legacy/をスキップし、まだテストに触れないでください」）、その後実行させてください。

プロのヒント：Opusで計画し、Sonnetで実行します。Opusの最高価値の使用は、計画自体を書くことです。ここで、より深い推論が実際に報われます。良い計画が存在すると、実行はほぼ機械的であり、Sonnetはコストの一部で処理します。このパターンは/model opusplanとして組み込まれており、計画中はOpusを使用し、実行中はSonnetを使用します。モデルを切り替えても会話はクリアされないため、Sonnetはまだ、Opusが生成したすべてを見ています。

上限に達したときの対処方法

Enterpriseシートユーザー：メッセージはウィンドウがいつリセットされるかを示します。その間、/modelで軽いモデルに切り替えるか、組織が許可している場合は、一時的にAPIキーにフォールバックできます。
APIキーユーザー：使用量の上限はありませんが、支出が懸念される場合は/costとConsoleまたはクラウドプロバイダーのダッシュボードを確認してください。予期しない高い数値は、ほぼ常に、クリアされたことのない非常に長いセッションに遡ります。
コンテキストウィンドウが満杯（使用制限とは異なります）：/compactを実行して続行するか、古い履歴がもはや必要ない場合は/clearを実行してください。

クイックリファレンス

コマンド	機能
`/model`	利用可能なモデルを表示して切り替えます。
`/cost`	このセッションのトークンとドル使用量を表示します（APIの請求）。
`/clear`	新しい会話を開始します（プロジェクトメモリは残ります）。
`/compact`	履歴を要約してコンテキストを解放します。
`/context`	現在コンテキストに読み込まれているものを検査します。