Claude Enterprise Verbrauchsleitfaden

Claude Enterprise gibt Ihrer Organisation Zugriff auf leistungsstarke KI über Chat, Claude Code und Claude Cowork. Mit diesem Zugriff kommt die Verantwortung, den Verbrauch effektiv zu verwalten – um sicherzustellen, dass Ihr Team maximalen Wert erhält und die Nutzung vorhersehbar und im Budget bleibt.

Dieser Leitfaden führt Enterprise-Administratoren durch die wichtigsten Hebel zur Kontrolle und Optimierung des Token-Verbrauchs: Festlegung von Ausgabengrenzen, Konfiguration rollenbasierter Zugriffskontrolle, Schulung von Benutzern und Auswahl des richtigen Modells für die richtige Aufgabe.

Warum Verbrauchsverwaltung wichtig ist

Claude Enterprise wird nach einem Pro-Sitz-, nutzungsbasierten Modell abgerechnet. Der Verbrauchspool Ihrer Organisation wird von allen Benutzern gemeinsam genutzt, und einige Oberflächen – besonders Claude Code und Cowork – verbrauchen Token mit deutlich höherer Rate als Standard-Chat.

Administratoren, die proaktiv Ausgabengrenzen konfigurieren und Benutzer schulen, können Verschwendung reduzieren und sicherstellen, dass hochwertige Anwendungsfälle die benötigte Kapazität erhalten.

Token-Intensität über Oberflächen hinweg verstehen

Oberfläche	Token-Intensität und was sie antreibt
Core Chat	Niedrige Intensität. Standardmäßige Hin- und Her-Konversation, Zusammenfassung, Entwurfserstellung und Fragen und Antworten. Die Token-Nutzung skaliert mit der Nachrichtenlänge und dem Gesprächsverlauf.
Claude Code	Höhere Intensität. Jede Codiersitzung umfasst System-Prompts, Dateikontext, Tool-Aufrufe und mehrstufiges Reasoning – mehr Token pro Sitzung als Chat.
Claude Cowork	Höhere Intensität. Agentengesteuerte Workflows, mehrstufige Aufgabenausführung und Skills generieren erhebliche Zwischentoken-Nutzung, die für Endbenutzer möglicherweise nicht sichtbar ist.

Admin-Tipp: Legen Sie Erwartungen mit Ihrem Team fest

Benutzer, die Claude Code oder Cowork-Workflows ausführen, sind sich möglicherweise nicht bewusst, wie token-intensiv ihre Sitzungen sind. Eine einzelne Cowork-Aufgabe oder Claude Code-Debug-Sitzung kann viel mehr Token verbrauchen als Chat. Beziehen Sie diesen Kontext in jede Benutzer-Onboarding-Kommunikation ein, die Sie versenden.

Rollenbasierte Zugriffskontrolle

Rollenbasierte Zugriffskontrolle (RBAC) ermöglicht es Ihnen, Benutzer zu gruppieren und ihren Zugriff auf Claude-Oberflächen und Verbrauchsbudgets als Einheit statt einzeln zu verwalten. Dies ist die skalierbarste Methode zur Verwaltung der Nutzung in größeren Organisationen.

Wie man Gruppen strukturiert

Denken Sie über Gruppen in Bezug auf Jobfunktion und Anwendungsfall nach, nicht in Bezug auf Organisationshierarchie. Ein paar Prinzipien:

Erstellen Sie Gruppen, die unterschiedlichen Nutzungsmustern entsprechen, nicht Organigramm-Feldern. "Engineering" und "Sales" sind nützlicher als "Nordamerika" und "EMEA" für die Verbrauchsverwaltung.
Begrenzen Sie die Gruppenverbreitung. Mehr als 8–10 Gruppen werden schwer zu verwalten. Beginnen Sie mit 4–6 und teilen Sie nur auf, wenn sich die Nutzungsmuster deutlich unterscheiden.
Verwenden Sie Gruppen, um den Zugriff auf hochintensive Oberflächen zu kontrollieren. Zum Beispiel: Nur Mitglieder der Gruppe "Engineering" können auf Claude Code zugreifen; andere Benutzer sehen nur Chat und Cowork.
Weisen Sie Ausgabengrenzen auf Gruppenebene als Ausgangspunkt zu, und überschreiben Sie dann auf Benutzerebene für Ausreißer (z. B. ein nicht-technischer PM, der Claude Code für ein bestimmtes Projekt benötigt).

Ausgabenverwaltung auf Gruppenebene

Sobald Gruppen konfiguriert sind:

Überprüfen Sie den Gruppenverbrauch wöchentlich während des anfänglichen Rollouts, danach monatlich.
Wenn eine Gruppe sich ihrer Grenze konsistent nähert, untersuchen Sie, bevor Sie die Grenze automatisch erhöhen – die richtige Antwort könnte Modellanleitungen sein (verwenden Sie Sonnet statt Opus) statt mehr Budget.
Erwägen Sie, in jeder Abteilung einen "Gruppeneigentümer" zuzuweisen, der für die Überprüfung der Nutzung und die Beantwortung von Fragen seines Teams verantwortlich ist. Dies verteilt die Admin-Last und bringt jemanden mit geschäftlichem Kontext ins Spiel. Bitte beachten Sie, dass dies diesen Personen Admin-Rechte gewähren würde, was möglicherweise nicht gewünscht ist.

Governance-Tipp: Oberflächenzugriff als erstes Tor

Bevor Sie sich Gedanken über Token-Limits machen, stellen Sie sicher, dass die richtigen Personen Zugriff auf die richtigen Oberflächen haben. Allen Claude Code und Cowork-Zugriff am ersten Tag zu geben, ist der schnellste Weg, um unerwarteten Verbrauch zu generieren. Führen Sie hochintensive Oberflächen in Wellen aus, beginnend mit den Teams, die sie am produktivsten nutzen werden.

Ausgabengrenzen festlegen

Ausgabengrenzen sind Ihr primäres Werkzeug zur Kontrolle des Verbrauchs. Claude Enterprise ermöglicht es Administratoren, Limits auf drei Ebenen festzulegen: auf Organisationsebene, auf Gruppenebene (mit RBAC) und auf individueller Benutzerebene. Unser empfohlener Ansatz ist, mit RBAC-Limits auf Gruppenebene und Pro-Benutzer-Limits zu beginnen – diese geben Ihnen präzise, gezielte Kontrolle ohne das Risiko, Ihre gesamte Organisation zu unterbrechen, wenn ein Limit erreicht wird.

Ausgabengrenzen auf Organisationsebene

Das Limit auf Organisationsebene ist als harte Obergrenze für alle Benutzer und Oberflächen verfügbar, aber verwenden Sie es mit Bedacht: Das Erreichen wirkt sich auf alle gleichzeitig aus, was störend sein kann. Die meisten Administratoren stellen fest, dass die Verwaltung des Verbrauchs auf Gruppen- und Benutzerebene bessere Ergebnisse mit weniger operativem Risiko bringt.

Ausgabenlimit auf Gruppenebene

Ausgabenlimits auf Gruppenebene ermöglichen es Ihnen, ein monatliches Ausgabenlimit pro Benutzer einer ganzen Gruppe zuzuweisen, sodass jedes Mitglied dieser Gruppe das gleiche Limit erbt, ohne es einzeln festzulegen. Dies ist die skalierbarste Methode zur Verwaltung des Verbrauchs in mittleren bis großen Organisationen, und hier sollten Administratoren beginnen.

Beachten Sie die folgenden Vorrangregeln:

Individuelle Limits überschreiben immer Gruppenlimits, unabhängig davon, welches höher ist.
Wenn ein Benutzer mehreren Gruppen mit unterschiedlichen Limits angehört, kann die Organisation entweder das niedrigste oder höchste Ausgabenlimit anwenden. Verwenden Sie das Dropdown-Menü unter "Spending defaults", um den gewünschten Vorrang festzulegen. Beachten Sie, dass das Standardlimit für den Sitztyp auch in diesen Vergleich einbezogen wird.
Organisationsweite Limits bleiben die harte Obergrenze.
Kein Limit überall = kein Limit. Wenn ein Mitglied kein individuelles Limit hat und keine seiner Gruppen ein Limit hat, ist sein Ausgabenbudget nicht begrenzt.

So konfigurieren Sie: Organisationseinstellungen > Nutzung > Nach Gruppe. Legen Sie Limits entweder auf einen bestimmten Dollarbetrag oder "Unbegrenzt" fest.

Ausgabengrenzen auf Benutzerebene

Ausgabengrenzen auf Benutzerebene ermöglichen es Ihnen, Verbrauchslimits für einzelne Konten festzulegen. Diese sind für Organisationen unerlässlich, in denen die Nutzung je nach Rolle erheblich variiert – ein Entwickler, der täglich Claude Code nutzt, hat sehr unterschiedliche Anforderungen als ein Vermarkter, der Chat für Copywriting nutzt.

Best Practices für Ausgabengrenzen auf Benutzerebene:

Definieren Sie Verbrauchsstufen basierend auf Rollentyp vor dem Rollout. Eine gestaffelte Struktur – z. B. leicht, standard, power – macht es einfacher, Limits konsistent zuzuweisen und anzupassen.
Beginnen Sie konservativ. Es ist einfacher, ein Limit basierend auf der Anfrage eines Benutzers zu erhöhen, als ein Überschreitungsgespräch rückgängig zu machen.
Geben Sie Power-Usern (Ingenieuren, Datenwissenschaftlern, Forschern) höhere oder unbegrenzte individuelle Limits, gleichen Sie dies aber aus, indem Sie sicherstellen, dass sie das richtige Claude-Modell für die richtige Aufgabe verwenden.
Überwachen Sie monatlich individuelle Nutzungsberichte, um Ausreißer zu identifizieren – sowohl Benutzer, die konsistent ihr Limit erreichen (möglicherweise mehr benötigen) als auch Benutzer, die sehr wenig verbrauchen (möglicherweise noch nicht aktiviert).

Empfohlene Ausgangspunkte

Benutzertyp	Code	Cowork	Chat
Power (Top 10%)	$200	$100	$50
Typisch (Mittelwert)	$85	$50	$20
Leicht (Median)	$25	$20	$5

*Diese Zahlen sind grobe Planungsschätzungen. Der tatsächliche Verbrauch variiert je nach Teamgröße, Workflows und Nutzungsmustern.

Anleitung zur Modellauswahl

Eine der wirkungsvollsten Maßnahmen, die ein Administrator ergreifen kann, ist die Festlegung klarer Richtlinien für Benutzer, welches Modell für welche Aufgaben verwendet werden sollte. Die Modellwahl hat einen direkten und erheblichen Einfluss auf den Token-Verbrauch – Opus kann für dieselbe Aufgabe mehrmals mehr Token verbrauchen als Sonnet.

Das richtige Modell für die richtige Aufgabe

Modell	Am besten geeignet für	Token-Intensität	Empfohlene Verwendung
Claude Sonnet	Alltägliche Aufgaben, Schreiben, Analyse, Fragen und Antworten	Moderat	Standardmodell für alle Benutzer – als organisationsweiter Standard festlegen
Claude Opus	Komplexes Denken, Forschung, mehrstufige Aufgaben	Hoch	Reservieren Sie für Power-User oder spezifische Workflows
Claude Haiku	Einfache Nachschlagungen, Zusammenfassungen, schnelle Antworten	Niedrig	Hochvolumige, leichte Automatisierungsaufgaben

Empfehlungen zur Admin-Konfiguration

Wenn Sie hochvolumige, wenig komplexe Workflows haben (z. B. Zusammenfassung von Support-Tickets, Generierung von Entwürfen für E-Mails), prüfen Sie, ob Haiku besser geeignet ist – es kann den Verbrauch für diese Anwendungsfälle erheblich reduzieren.
Überprüfen Sie regelmäßig, welche Modelle Ihre Benutzer tatsächlich auswählen. Wenn der Großteil Ihres Verbrauchs auf Opus entfällt, ist das ein Signal, dass Ihre Modellrichtlinien nicht ankommen.

Was Sie Ihren Benutzern über die Modellwahl mitteilen sollten

Sonnet ist Ihr tägliches Arbeitspferd. Es ist schnell, hochgradig leistungsfähig und für die überwiegende Mehrheit der Aufgaben konzipiert – Schreiben, Analyse, Codierungshilfe und Fragen und Antworten.

Opus ist für die schwierigere, komplexere Arbeit. Verwenden Sie es, wenn Sie an einem wirklich komplexen mehrstufigen Problem arbeiten oder wenn Qualität wichtiger ist als Geschwindigkeit.

Im Zweifelsfall mit Sonnet beginnen. Sie können das Modell jederzeit während eines Gesprächs zu Opus wechseln, wenn Sie mehr Tiefe benötigen.

Verwendung von Organisationseinstellungen zur Gestaltung des Benutzerverhaltens

Organisationseinstellungen ermöglichen es Administratoren, ständige Richtlinien in jedes Claude-Gespräch in Ihrer Organisation einzufügen – und geben Claude effektiv einen System-Prompt, der die Normen, Best Practices und Schutzmaßnahmen Ihres Teams widerspiegelt. Dies ist ein hochgradig wirksames Instrument zur Änderung des Benutzerverhaltens ohne zusätzliche Reibung, da die Richtlinien im Produkt zum Zeitpunkt der Verwendung angezeigt werden, anstatt in Dokumentationen, die Benutzer erst finden müssen.

Einige Möglichkeiten, wie Sie Organisationseinstellungen nutzen können, um Verbrauch und Nutzungsmuster zu verwalten:

Warnen Sie vor Token-intensiven Ausgabeformaten. Wenn Sie eine Verbreitung eines bestimmten Artefakttyps bemerkt haben (z. B. HTML-Dashboards, die in funktionsübergreifenden Threads geteilt werden, wo ein einfacheres Format ausreichen würde), können Sie Claude anweisen, den Benutzer zu bestätigen, bevor er eines generiert. Dies fügt eine leichte Überprüfung hinzu, ohne die Funktionalität vollständig zu entfernen.
Leiten Sie Benutzer zu internen Ressourcen. Verweisen Sie direkt in der Einstellung auf das Wiki, Best-Practice-Dokumente oder Nutzungsrichtlinien Ihres Teams. Claude wird diese anzeigen, wenn relevant – und lenkt Benutzer zum richtigen internen Kontext, statt ihn jedes Mal neu zu erfinden.
Verstärken Sie die Modellauswahlnormen. Erinnern Sie Claude (und damit auch die Benutzer) daran, dass Sonnet das Standard-Modell ist und Opus für spezifische Workflows reserviert ist. Dies ergänzt die Benutzeraufklärung, ohne dass alle dies von Anfang an verinnerlichen müssen.

Nutzung und Ausgaben verfolgen

Seite „Analytik

Die Seite „Analytik

CSV-Export des Ausgabenberichts

Wenn Sie eine einmalige detaillierte Aufschlüsselung benötigen, können Sie einen Ausgabenbericht pro Benutzer und Modell als CSV aus Analytik > Alle Aktivitäten > Ausgaben > Ausgaben exportieren exportieren. Wählen Sie MTD, letzten Monat, letzte 90 Tage oder einen benutzerdefinierten Bereich bis zu 90 Tage zurück. Die CSV enthält Benutzer-E-Mail, Benutzer-ID, Konto-UUID, Produkt, Modell, Anfragezahl, Prompt- und Completion-Token sowie Netto- und Bruttoausgaben in USD.

Analytik-Chat

Mit dem Analytik-Chat können Sie Fragen zur Nutzung Ihrer Organisation in natürlicher Sprache stellen. Geben Sie eine Frage ein – „Zeige mir die täglichen Ausgaben der letzten 30 Tage

Verwenden Sie dies, wenn Sie eine spezifische Frage haben und das Dashboard nicht durchsuchen möchten, oder wenn Sie Trends erkunden und schnelle Hin- und Herbewegungen wünschen. Die Ergebnisse decken standardmäßig die letzten 30 Tage ab; geben Sie in Ihrer Frage einen anderen Bereich an, falls erforderlich. Daten werden täglich aktualisiert. Weitere Informationen.

Analytik-API

Für programmgesteuerten Zugriff verwenden Sie die Claude Enterprise Analytics API. Rufen Sie eine nach Tokens oder Dollar ausgegebenen Benutzerliste ab, oder sehen Sie sich Nutzungs- und Kostentrends im Zeitverlauf an, aufgeschlüsselt nach Produkt, Modell, Kontextfenster oder Region. Jede Anfrage ist auf 31 Tage begrenzt, beginnend innerhalb der letzten 365 Tage und nicht früher als 1. Januar 2026.

Ihr Primary Owner kann einen Admin-API-Schlüssel generieren. Daten werden alle vier Stunden aktualisiert; für Rechnungsqualitäts-Gesamtsummen sollten Sie Daten von vor 30+ Tagen abfragen, damit späte Ereignisse Zeit zur Abstimmung haben. Weitere Informationen und lesen Sie das API-Referenzhandbuch.

Schulung von Endbenutzern

Technologische Kontrollen bringen Sie schon sehr weit, aber das Benutzerverhalten macht den Rest aus. Ein Team, das versteht, wie der Verbrauch funktioniert, trifft unabhängig bessere Entscheidungen – und bringt weniger Grenzfälle zur Fehlerbehebung zu Ihnen.

Was Sie Endbenutzern mitteilen sollten

Wenn Sie Benutzer einarbeiten, teilen Sie Folgendes mit:

Wie Claude abgerechnet wird

Die Nutzung wird in Token gemessen. Lange Prompts und lange Gespräche verbrauchen mehr Token.
Claude Code und Cowork-Sitzungen sind deutlich token-intensiver als Chat. Eine einzelne lange Codierungssitzung kann viel mehr Token verbrauchen als eine typische Chat-Sitzung.
Überprüfen Sie Ihre Nutzung in den Einstellungen, indem Sie zu Einstellungen → Nutzung wechseln.

Wie man ein Modell auswählt

Sonnet ist das Standard-Modell und bewältigt die meisten Aufgaben gut. Verwenden Sie Opus nur, wenn Sonnet Sie nicht dorthin bringt, wo Sie sein müssen.
Der Modellwähler ist in der Benutzeroberfläche sichtbar – erinnern Sie Benutzer, ihn zu überprüfen, besonders wenn sie komplexe Aufgaben ausführen.
Der Modellwähler ist persistent, also machen Sie es sich zur Gewohnheit, zu überprüfen, dass es das Modell ist, das Sie verwenden möchten!

Was passiert, wenn sie ein Limit erreichen

Wenn ein Benutzer sein individuelles Limit erreicht, kann er sich an seinen Gruppenbesitzer oder das IT-/Admin-Team wenden, um eine Erhöhung anzufordern.
Sie verlieren keine laufenden Arbeiten – Claude wird den aktuellen Durchgang abschließen, bevor die weitere Nutzung eingeschränkt wird.

Verwandte Artikel

Wie groß ist das Kontextfenster der Claude API?

Claude Code Modellkonfiguration

Versionshinweise

Modellverfügbarkeit in Claude for Government

Modelle, Nutzung und Limits in Claude Code