Diese Anleitung erklärt, welches Modell Sie verwenden, wie die Nutzung gemessen wird und wie Sie lange Sitzungen innerhalb ihrer Kontext- und Nutzungslimits halten.
Wie die Nutzung gemessen wird
Wie Sie sich anmelden, bestimmt, wie die Nutzung gemessen wird. Alles andere in Claude Code funktioniert unabhängig davon gleich.
Sie haben sich angemeldet mit… | Sie erhalten | So sieht es aus, wenn Sie „aufgebraucht" sind" |
Claude Enterprise-Sitz (über | Ein Nutzungspool, der in Ihrem Organisationsplan enthalten ist und sich in einem rollierenden Fenster zurückgesetzt wird. | Eine Meldung „Limit erreicht, setzt sich um Zeit zurück"." |
API-Schlüssel (Console, Bedrock oder Vertex) | Pay-as-you-go, abgerechnet pro Token für dieses Cloud- oder Console-Konto. | Kein harter Stopp; das Konto wird für das belastet, was es nutzt. |
Wenn Sie sich mit einem Enterprise-Sitz angemeldet haben, müssen Sie normalerweise nicht über Token nachdenken, bis Sie ein Limit erreichen. Wenn Sie einen API-Schlüssel verwenden, zeigt der Befehl /cost Ihre laufenden Ausgaben für die aktuelle Sitzung.
Ein Modell auswählen
Führen Sie jederzeit /model aus, um zu sehen, welche Modelle für Ihr Konto verfügbar sind und um zwischen ihnen zu wechseln. Als grobe Richtlinie:
Sonnet ist die Standardeinstellung und die richtige Wahl für die große Mehrheit der Codierungsarbeiten. Es ist schnell, leistungsfähig und kostengünstig.
Opus bietet tiefere Überlegungen für schwierigere Probleme wie große übergreifende Umgestaltungen, schwieriges Debugging oder architektonische Entscheidungen. Es verbraucht deutlich mehr Ihres Kontingents, daher wechseln Sie zu ihm, wenn Sie ihn benötigen, anstatt ihn standardmäßig eingeschaltet zu lassen.
Haiku ist die schnellste und günstigste Option, gut geeignet für schnelle Nachschlagungen, einfache Bearbeitungen oder Skriptläufe mit hohem Volumen.
Sie können Modelle während einer Sitzung wechseln, ohne Ihr Gespräch zu verlieren. Ein häufiges Muster ist die Planung mit Opus und die Ausführung mit Sonnet.
Hinweis: Genaue Modellnamen, Versionen und Verfügbarkeit ändern sich im Laufe der Zeit. Der Befehl /model ist immer die Quelle der Wahrheit für Ihr Konto.
Was tatsächlich Token verbraucht
Jede Runde sendet drei Dinge an das Modell:
Das bisherige Gespräch — jede vorherige Nachricht in dieser Sitzung.
Projektkontext — Ihre
CLAUDE.mdund alle Dateien, die Claude gelesen hat.Ihre neue Eingabeaufforderung.
Von diesen wächst das erste Element am schnellsten. Eine lange Debugging-Sitzung, in der Claude zwanzig Dateien gelesen und fünfzehn Diffs erstellt hat, trägt all das bei jeder nachfolgenden Nachricht mit sich. Hier stammen sowohl Kosten als auch Kontextlimits her.
Verwalten des Kontextfensters
Das Kontextfenster ist die maximale Textmenge, die das Modell auf einmal berücksichtigen kann. Claude Code zeigt einen Live-Indikator, wie voll es ist. Wenn es sich füllt, kann Claude die ältesten Teile des Gesprächs nicht mehr klar sehen und die Qualität sinkt.
Zwei Befehle halten es unter Kontrolle:
/clearlöscht das Gespräch und startet von vorne. IhreCLAUDE.mdund Projektdateien bleiben verfügbar; nur der Chat-Verlauf wird entfernt. Verwenden Sie dies, wenn Sie die Aufgabe wechseln, da es der einzelne wirksamste Hebel für Qualität und Kosten ist./compactfasst das bisherige Gespräch in eine kurze Zusammenfassung zusammen und gibt Platz frei, während der wesentliche Kontext erhalten bleibt. Verwenden Sie dies, wenn Sie sich mitten in einer Aufgabe befinden und weitermachen müssen. Claude Code komprimiert auch automatisch, wenn Sie sich dem Limit nähern, sodass Sie selten auf eine harte Grenze stoßen.
Faustregel: Verwenden Sie /clear, wenn Sie eine neue Aufgabe starten, und /compact, wenn Sie eine lange fortsetzen.
Fünf Gewohnheiten, die Ihre Nutzung am weitesten dehnen
Fast jeder Bericht „Ich habe mein Limit bis zum Mittag aufgebraucht" lässt sich auf einen dieser fünf zurückführen."
1. Zwischen Aufgaben löschen
Jede vorherige Nachricht wird bei jeder Runde erneut gesendet, daher zahlt eine Sitzung, die durch drei unabhängige Probleme gewandert ist, für alle drei bei jeder neuen Nachricht. In der Praxis: Sie haben gerade das Debugging einer Login-Umleitung abgeschlossen und möchten jetzt eine Datenbankmigrationen schreiben. Führen Sie zuerst /clear aus. Ein einfacher Test: Wenn Ihre nächste Eingabeaufforderung in einem brandneuen Terminal perfekt Sinn machen würde, löschen Sie vor dem Senden. Ihre CLAUDE.md und Projektdateien bleiben erhalten; nur der Chat-Verlauf wird gelöscht. Eine Warnung: /clear kann nicht rückgängig gemacht werden. Wenn Sie möglicherweise noch etwas aus dem Verlauf benötigen, kopieren Sie es zuerst aus oder führen Sie stattdessen /compact aus, das eine Zusammenfassung beibehält, anstatt alles zu löschen.
2. Passen Sie das Modell an die Aufgabe an
Opus kostet pro Runde mehrmals mehr als Sonnet, und Sonnet mehr als Haiku. Opus für Routinearbeiten auszugeben ist der schnellste Weg, ein tägliches Limit zu erschöpfen. Angemessene Standardeinstellungen: Sonnet für die meisten Codierungen (Features, Tests, bekannte Fehler, Umgestaltungen); Opus, wenn Sie wirklich stecken bleiben oder die Änderung umfangreich ist (schwieriges Debugging, übergreifende Umgestaltungen, Architekturentscheidungen); Haiku für schnelle mechanische Arbeiten (Umbenennungen, Protokollzeilen, Regex-Erklärungen, Boilerplate).
3. Zeigen Sie auf Dateien, anstatt sie einzufügen
Alles, was Sie einfügen, bleibt im Kontext, vollständig, für den Rest der Sitzung. Das Referenzieren einer Datei nach Pfad ermöglicht es Claude, selektiv zu lesen und sich auf den Teil zu konzentrieren, der Sie interessiert. In der Praxis: Anstatt auth.ts einzufügen, schreiben Sie look at the validateToken function in @src/auth.ts. Für Protokolle und Stack-Traces schneiden Sie auf die relevanten 20 oder 30 Zeilen zu, bevor Sie einfügen. Für alles Große (Sperrdateien, Build-Protokolle, Datendumps) legen Sie es auf die Festplatte und referenzieren Sie den Pfad.
4. Halten Sie CLAUDE.md schlank
Diese Datei wird jeder Runde vorangestellt, daher werden ihre Kosten mit der Anzahl der Nachrichten multipliziert, die Sie senden. Eine 300-zeilige CLAUDE.md über eine 40-Runden-Sitzung sind 12.000 Zeilen Input, die Sie bezahlt haben, bevor Sie irgendwelche Arbeiten erledigt haben. Die Regel: zwei Streiche, ein Bildschirm. Fügen Sie eine Notiz nur hinzu, wenn Sie Claude zum zweiten Mal auf die gleiche Sache korrigieren müssen (Probleme beim ersten Mal sind normalerweise Einzelfälle). Und lassen Sie die Datei niemals über einen einzelnen Bildschirm von etwa 80 bis 100 Zeilen wachsen; wenn etwas Neues hinzugefügt werden muss und es gibt keinen Platz, muss etwas Altes heraus. Wann aktualisiert werden: direkt nach einer Sitzung, in der Sie Claude zweimal auf die gleiche Sache korrigieren mussten. Das ist, wenn die Lösung frisch ist und eine Minute dauert, um aufzuschreiben. Lesen Sie alle paar Wochen die ganze Datei durch und löschen Sie alles, das nicht mehr wahr ist oder dessen Zweck Sie nicht mehr erinnern können. Veraltete Notizen sind schlimmer als fehlende Notizen, weil sie Claude aktiv in die Irre führen.
5. Fragen Sie nach einem Plan vor großen Änderungen
Ein Plan kostet ein paar hundert Token. Ein falscher 400-Zeilen-Diff, den Sie rückgängig machen und neu generieren, kostet Tausende, zweimal, plus die Runden, die damit verbracht werden, zu erklären, was schief gelaufen ist. In der Praxis: Für alles, das mehr als zwei oder drei Dateien berührt, wechseln Sie zu Plan Mode oder fragen Sie einfach: „Bevor Sie etwas ändern, listen Sie die Dateien auf, die Sie berühren werden, und was Sie in jeder tun werden.
Profi-Tipp: Planen Sie mit Opus, führen Sie mit Sonnet aus. Die höchstwertige Verwendung von Opus ist das Schreiben des Plans selbst, wo tiefere Überlegungen tatsächlich auszahlen. Sobald ein guter Plan vorhanden ist, ist die Ausführung größtenteils mechanisch und Sonnet handhabt es zu einem Bruchteil der Kosten. Arbeitsablauf: /model opus, fragen Sie nach dem Plan, überprüfen und korrigieren Sie ihn, dann /model sonnet und „führen Sie den obigen Plan aus.
Was zu tun ist, wenn Sie ein Limit erreichen
Enterprise-Sitz-Benutzer: Die Meldung teilt Ihnen mit, wann Ihr Fenster zurückgesetzt wird. In der Zwischenzeit können Sie mit
/modelzu einem leichteren Modell wechseln oder, falls Ihre Organisation dies zulässt, vorübergehend auf einen API-Schlüssel zurückgreifen.API-Schlüssel-Benutzer: Es gibt keine Nutzungsobergrenze, aber überprüfen Sie
/costund Ihr Console- oder Cloud-Provider-Dashboard, wenn die Ausgaben ein Problem darstellen. Unerwartet hohe Zahlen lassen sich fast immer auf sehr lange Sitzungen zurückführen, die nie gelöscht wurden.Kontextfenster voll (was sich von einem Nutzungslimit unterscheidet): Führen Sie
/compactaus, um weiterzumachen, oder/clear, wenn die ältere Historie nicht mehr benötigt wird.
Schnellreferenz
Befehl | Was es tut |
| Verfügbare Modelle anzeigen und wechseln. |
| Token- und Dollar-Nutzung dieser Sitzung anzeigen (API-Abrechnung). |
| Ein neues Gespräch starten (Projektgedächtnis bleibt). |
| Verlauf zusammenfassen, um Kontext freizugeben. |
| Überprüfen Sie, was derzeit in den Kontext geladen ist. |
