Claude Enterprise gibt Ihrer Organisation Zugriff auf leistungsstarke KI über Chat, Claude Code und Claude Cowork. Mit diesem Zugriff kommt die Verantwortung, den Verbrauch effektiv zu verwalten – um sicherzustellen, dass Ihr Team maximalen Wert erhält und die Nutzung vorhersehbar und im Budget bleibt.
Dieser Leitfaden führt Enterprise-Administratoren durch die wichtigsten Hebel zur Kontrolle und Optimierung des Token-Verbrauchs: Festlegung von Ausgabengrenzen, Konfiguration rollenbasierter Zugriffskontrolle, Schulung von Benutzern und Auswahl des richtigen Modells für die richtige Aufgabe.
Warum Verbrauchsverwaltung wichtig ist
Claude Enterprise wird nach einem Pro-Sitz-, nutzungsbasierten Modell abgerechnet. Der Verbrauchspool Ihrer Organisation wird von allen Benutzern gemeinsam genutzt, und einige Oberflächen – besonders Claude Code und Cowork – verbrauchen Token mit deutlich höherer Rate als Standard-Chat.
Administratoren, die proaktiv Ausgabengrenzen konfigurieren und Benutzer schulen, können Verschwendung reduzieren und sicherstellen, dass hochwertige Anwendungsfälle die benötigte Kapazität erhalten.
Token-Intensität über Oberflächen hinweg verstehen
Oberfläche | Token-Intensität und was sie antreibt |
Core Chat | Niedrige Intensität. Standardmäßige Hin- und Her-Konversation, Zusammenfassung, Entwurfserstellung und Fragen und Antworten. Die Token-Nutzung skaliert mit der Nachrichtenlänge und dem Gesprächsverlauf. |
Claude Code | Höhere Intensität. Jede Codiersitzung umfasst System-Prompts, Dateikontext, Tool-Aufrufe und mehrstufiges Reasoning – mehr Token pro Sitzung als Chat. |
Claude Cowork | Höhere Intensität. Agentengesteuerte Workflows, mehrstufige Aufgabenausführung und Skills generieren erhebliche Zwischentoken-Nutzung, die für Endbenutzer möglicherweise nicht sichtbar ist. |
Admin-Tipp: Legen Sie Erwartungen mit Ihrem Team fest
Benutzer, die Claude Code oder Cowork-Workflows ausführen, sind sich möglicherweise nicht bewusst, wie token-intensiv ihre Sitzungen sind. Eine einzelne Cowork-Aufgabe oder Claude Code-Debug-Sitzung kann viel mehr Token verbrauchen als Chat. Beziehen Sie diesen Kontext in jede Benutzer-Onboarding-Kommunikation ein, die Sie versenden.
Rollenbasierte Zugriffskontrolle
Rollenbasierte Zugriffskontrolle (RBAC) ermöglicht es Ihnen, Benutzer zu gruppieren und ihren Zugriff auf Claude-Oberflächen und Verbrauchsbudgets als Einheit statt einzeln zu verwalten. Dies ist die skalierbarste Methode zur Verwaltung der Nutzung in größeren Organisationen.
Wie man Gruppen strukturiert
Denken Sie über Gruppen in Bezug auf Jobfunktion und Anwendungsfall nach, nicht in Bezug auf Organisationshierarchie. Ein paar Prinzipien:
Erstellen Sie Gruppen, die unterschiedlichen Nutzungsmustern entsprechen, nicht Organigramm-Feldern. "Engineering" und "Sales" sind nützlicher als "Nordamerika" und "EMEA" für die Verbrauchsverwaltung.
Begrenzen Sie die Gruppenverbreitung. Mehr als 8–10 Gruppen werden schwer zu verwalten. Beginnen Sie mit 4–6 und teilen Sie nur auf, wenn sich die Nutzungsmuster deutlich unterscheiden.
Verwenden Sie Gruppen, um den Zugriff auf hochintensive Oberflächen zu kontrollieren. Zum Beispiel: Nur Mitglieder der Gruppe "Engineering" können auf Claude Code zugreifen; andere Benutzer sehen nur Chat und Cowork.
Weisen Sie Ausgabengrenzen auf Gruppenebene als Ausgangspunkt zu, und überschreiben Sie dann auf Benutzerebene für Ausreißer (z. B. ein nicht-technischer PM, der Claude Code für ein bestimmtes Projekt benötigt).
Ausgabenverwaltung auf Gruppenebene
Sobald Gruppen konfiguriert sind:
Überprüfen Sie den Gruppenverbrauch wöchentlich während des anfänglichen Rollouts, danach monatlich.
Wenn eine Gruppe sich ihrer Grenze konsistent nähert, untersuchen Sie, bevor Sie die Grenze automatisch erhöhen – die richtige Antwort könnte Modellanleitungen sein (verwenden Sie Sonnet statt Opus) statt mehr Budget.
Erwägen Sie, in jeder Abteilung einen "Gruppeneigentümer" zuzuweisen, der für die Überprüfung der Nutzung und die Beantwortung von Fragen seines Teams verantwortlich ist. Dies verteilt die Admin-Last und bringt jemanden mit geschäftlichem Kontext ins Spiel. Bitte beachten Sie, dass dies diesen Personen Admin-Rechte gewähren würde, was möglicherweise nicht gewünscht ist.
Governance-Tipp: Oberflächenzugriff als erstes Tor
Bevor Sie sich Gedanken über Token-Limits machen, stellen Sie sicher, dass die richtigen Personen Zugriff auf die richtigen Oberflächen haben. Allen Claude Code und Cowork-Zugriff am ersten Tag zu geben, ist der schnellste Weg, um unerwarteten Verbrauch zu generieren. Führen Sie hochintensive Oberflächen in Wellen aus, beginnend mit den Teams, die sie am produktivsten nutzen werden.
Ausgabengrenzen festlegen
Ausgabengrenzen sind Ihr primäres Werkzeug zur Kontrolle des Verbrauchs. Claude Enterprise ermöglicht es Administratoren, Limits auf drei Ebenen festzulegen: auf Organisationsebene, auf Gruppenebene (mit RBAC) und auf individueller Benutzerebene. Unser empfohlener Ansatz ist, mit RBAC-Limits auf Gruppenebene und Pro-Benutzer-Limits zu beginnen – diese geben Ihnen präzise, gezielte Kontrolle ohne das Risiko, Ihre gesamte Organisation zu unterbrechen, wenn ein Limit erreicht wird.
Ausgabengrenzen auf Organisationsebene
Das Limit auf Organisationsebene ist als harte Obergrenze für alle Benutzer und Oberflächen verfügbar, aber verwenden Sie es mit Bedacht: Das Erreichen wirkt sich auf alle gleichzeitig aus, was störend sein kann. Die meisten Administratoren stellen fest, dass die Verwaltung des Verbrauchs auf Gruppen- und Benutzerebene bessere Ergebnisse mit weniger operativem Risiko bringt.
Ausgabenlimit auf Gruppenebene
Ausgabenlimits auf Gruppenebene ermöglichen es Ihnen, ein monatliches Ausgabenlimit pro Benutzer einer ganzen Gruppe zuzuweisen, sodass jedes Mitglied dieser Gruppe das gleiche Limit erbt, ohne es einzeln festzulegen. Dies ist die skalierbarste Methode zur Verwaltung des Verbrauchs in mittleren bis großen Organisationen, und hier sollten Administratoren beginnen.
Beachten Sie die folgenden Vorrangregeln:
Individuelle Limits überschreiben immer Gruppenlimits, unabhängig davon, welches höher ist.
Wenn ein Benutzer mehreren Gruppen mit unterschiedlichen Limits angehört, kann die Organisation entweder das niedrigste oder höchste Ausgabenlimit anwenden. Verwenden Sie das Dropdown-Menü unter "Spending defaults", um den gewünschten Vorrang festzulegen. Beachten Sie, dass das Standardlimit für den Sitztyp auch in diesen Vergleich einbezogen wird.
Organisationsweite Limits bleiben die harte Obergrenze.
Kein Limit überall = kein Limit. Wenn ein Mitglied kein individuelles Limit hat und keine seiner Gruppen ein Limit hat, ist sein Ausgabenbudget nicht begrenzt.
So konfigurieren Sie: Organisationseinstellungen > Nutzung > Nach Gruppe. Legen Sie Limits entweder auf einen bestimmten Dollarbetrag oder "Unbegrenzt" fest.
Ausgabengrenzen auf Benutzerebene
Ausgabengrenzen auf Benutzerebene ermöglichen es Ihnen, Verbrauchslimits für einzelne Konten festzulegen. Diese sind für Organisationen unerlässlich, in denen die Nutzung je nach Rolle erheblich variiert – ein Entwickler, der täglich Claude Code nutzt, hat sehr unterschiedliche Anforderungen als ein Vermarkter, der Chat für Copywriting nutzt.
Best Practices für Ausgabengrenzen auf Benutzerebene:
Definieren Sie Verbrauchsstufen basierend auf Rollentyp vor dem Rollout. Eine gestaffelte Struktur – z. B. leicht, standard, power – macht es einfacher, Limits konsistent zuzuweisen und anzupassen.
Beginnen Sie konservativ. Es ist einfacher, ein Limit basierend auf der Anfrage eines Benutzers zu erhöhen, als ein Überschreitungsgespräch rückgängig zu machen.
Geben Sie Power-Usern (Ingenieuren, Datenwissenschaftlern, Forschern) höhere oder unbegrenzte individuelle Limits, gleichen Sie dies aber aus, indem Sie sicherstellen, dass sie das richtige Claude-Modell für die richtige Aufgabe verwenden.
Überwachen Sie monatlich individuelle Nutzungsberichte, um Ausreißer zu identifizieren – sowohl Benutzer, die konsistent ihr Limit erreichen (möglicherweise mehr benötigen) als auch Benutzer, die sehr wenig verbrauchen (möglicherweise noch nicht aktiviert).
Empfohlene Ausgangspunkte
Benutzertyp | Code | Cowork | Chat |
Power (Top 10%) | $200 | $100 | $50 |
Typisch (Mittelwert) | $85 | $50 | $20 |
Leicht (Median) | $25 | $20 | $5 |
*Diese Zahlen sind grobe Planungsschätzungen. Der tatsächliche Verbrauch variiert je nach Teamgröße, Workflows und Nutzungsmustern.
Anleitung zur Modellauswahl
Eine der wirkungsvollsten Maßnahmen, die ein Administrator ergreifen kann, ist die Festlegung klarer Richtlinien für Benutzer, welches Modell für welche Aufgaben verwendet werden sollte. Die Modellwahl hat einen direkten und erheblichen Einfluss auf den Token-Verbrauch – Opus kann für dieselbe Aufgabe mehrmals mehr Token verbrauchen als Sonnet.
Das richtige Modell für die richtige Aufgabe
Modell | Am besten geeignet für | Token-Intensität | Empfohlene Verwendung |
Claude Sonnet | Alltägliche Aufgaben, Schreiben, Analyse, Fragen und Antworten | Moderat | Standardmodell für alle Benutzer – als organisationsweiter Standard festlegen |
Claude Opus | Komplexes Denken, Forschung, mehrstufige Aufgaben | Hoch | Reservieren Sie für Power-User oder spezifische Workflows |
Claude Haiku | Einfache Nachschlagungen, Zusammenfassungen, schnelle Antworten | Niedrig | Hochvolumige, leichte Automatisierungsaufgaben |
Empfehlungen zur Admin-Konfiguration
Wenn Sie hochvolumige, wenig komplexe Workflows haben (z. B. Zusammenfassung von Support-Tickets, Generierung von Entwürfen für E-Mails), prüfen Sie, ob Haiku besser geeignet ist – es kann den Verbrauch für diese Anwendungsfälle erheblich reduzieren.
Überprüfen Sie regelmäßig, welche Modelle Ihre Benutzer tatsächlich auswählen. Wenn der Großteil Ihres Verbrauchs auf Opus entfällt, ist das ein Signal, dass Ihre Modellrichtlinien nicht ankommen.
Was Sie Ihren Benutzern über die Modellwahl mitteilen sollten
Sonnet ist Ihr tägliches Arbeitspferd. Es ist schnell, hochgradig leistungsfähig und für die überwiegende Mehrheit der Aufgaben konzipiert – Schreiben, Analyse, Codierungshilfe und Fragen und Antworten.
Opus ist für die schwierigere, komplexere Arbeit. Verwenden Sie es, wenn Sie an einem wirklich komplexen mehrstufigen Problem arbeiten oder wenn Qualität wichtiger ist als Geschwindigkeit.
Im Zweifelsfall mit Sonnet beginnen. Sie können das Modell jederzeit während eines Gesprächs zu Opus wechseln, wenn Sie mehr Tiefe benötigen.
Verwendung von Organisationseinstellungen zur Gestaltung des Benutzerverhaltens
Organisationseinstellungen ermöglichen es Administratoren, ständige Richtlinien in jedes Claude-Gespräch in Ihrer Organisation einzufügen – und geben Claude effektiv einen System-Prompt, der die Normen, Best Practices und Schutzmaßnahmen Ihres Teams widerspiegelt. Dies ist ein hochgradig wirksames Instrument zur Änderung des Benutzerverhaltens ohne zusätzliche Reibung, da die Richtlinien im Produkt zum Zeitpunkt der Verwendung angezeigt werden, anstatt in Dokumentationen, die Benutzer erst finden müssen.
Einige Möglichkeiten, wie Sie Organisationseinstellungen nutzen können, um Verbrauch und Nutzungsmuster zu verwalten:
Warnen Sie vor Token-intensiven Ausgabeformaten. Wenn Sie eine Verbreitung eines bestimmten Artefakttyps bemerkt haben (z. B. HTML-Dashboards, die in funktionsübergreifenden Threads geteilt werden, wo ein einfacheres Format ausreichen würde), können Sie Claude anweisen, den Benutzer zu bestätigen, bevor er eines generiert. Dies fügt eine leichte Überprüfung hinzu, ohne die Funktionalität vollständig zu entfernen.
Leiten Sie Benutzer zu internen Ressourcen. Verweisen Sie direkt in der Einstellung auf das Wiki, Best-Practice-Dokumente oder Nutzungsrichtlinien Ihres Teams. Claude wird diese anzeigen, wenn relevant – und lenkt Benutzer zum richtigen internen Kontext, statt ihn jedes Mal neu zu erfinden.
Verstärken Sie die Modellauswahlnormen. Erinnern Sie Claude (und damit auch die Benutzer) daran, dass Sonnet das Standard-Modell ist und Opus für spezifische Workflows reserviert ist. Dies ergänzt die Benutzeraufklärung, ohne dass alle dies von Anfang an verinnerlichen müssen.
Nutzung und Ausgaben verfolgen
Seite „Analytik
Die Seite „Analytik
CSV-Export des Ausgabenberichts
Wenn Sie eine einmalige detaillierte Aufschlüsselung benötigen, können Sie einen Ausgabenbericht pro Benutzer und Modell als CSV aus Analytik > Alle Aktivitäten > Ausgaben > Ausgaben exportieren exportieren. Wählen Sie MTD, letzten Monat, letzte 90 Tage oder einen benutzerdefinierten Bereich bis zu 90 Tage zurück. Die CSV enthält Benutzer-E-Mail, Benutzer-ID, Konto-UUID, Produkt, Modell, Anfragezahl, Prompt- und Completion-Token sowie Netto- und Bruttoausgaben in USD.
Analytik-Chat
Mit dem Analytik-Chat können Sie Fragen zur Nutzung Ihrer Organisation in natürlicher Sprache stellen. Geben Sie eine Frage ein – „Zeige mir die täglichen Ausgaben der letzten 30 Tage
Verwenden Sie dies, wenn Sie eine spezifische Frage haben und das Dashboard nicht durchsuchen möchten, oder wenn Sie Trends erkunden und schnelle Hin- und Herbewegungen wünschen. Die Ergebnisse decken standardmäßig die letzten 30 Tage ab; geben Sie in Ihrer Frage einen anderen Bereich an, falls erforderlich. Daten werden täglich aktualisiert. Weitere Informationen.
Analytik-API
Für programmgesteuerten Zugriff verwenden Sie die Claude Enterprise Analytics API. Rufen Sie eine nach Tokens oder Dollar ausgegebenen Benutzerliste ab, oder sehen Sie sich Nutzungs- und Kostentrends im Zeitverlauf an, aufgeschlüsselt nach Produkt, Modell, Kontextfenster oder Region. Jede Anfrage ist auf 31 Tage begrenzt, beginnend innerhalb der letzten 365 Tage und nicht früher als 1. Januar 2026.
Ihr Primary Owner kann einen Admin-API-Schlüssel generieren. Daten werden alle vier Stunden aktualisiert; für Rechnungsqualitäts-Gesamtsummen sollten Sie Daten von vor 30+ Tagen abfragen, damit späte Ereignisse Zeit zur Abstimmung haben. Weitere Informationen und lesen Sie das API-Referenzhandbuch.
Schulung von Endbenutzern
Technologische Kontrollen bringen Sie schon sehr weit, aber das Benutzerverhalten macht den Rest aus. Ein Team, das versteht, wie der Verbrauch funktioniert, trifft unabhängig bessere Entscheidungen – und bringt weniger Grenzfälle zur Fehlerbehebung zu Ihnen.
Was Sie Endbenutzern mitteilen sollten
Wenn Sie Benutzer einarbeiten, teilen Sie Folgendes mit:
Wie Claude abgerechnet wird
Die Nutzung wird in Token gemessen. Lange Prompts und lange Gespräche verbrauchen mehr Token.
Claude Code und Cowork-Sitzungen sind deutlich token-intensiver als Chat. Eine einzelne lange Codierungssitzung kann viel mehr Token verbrauchen als eine typische Chat-Sitzung.
Überprüfen Sie Ihre Nutzung in den Einstellungen, indem Sie zu Einstellungen → Nutzung wechseln.
Wie man ein Modell auswählt
Sonnet ist das Standard-Modell und bewältigt die meisten Aufgaben gut. Verwenden Sie Opus nur, wenn Sonnet Sie nicht dorthin bringt, wo Sie sein müssen.
Der Modellwähler ist in der Benutzeroberfläche sichtbar – erinnern Sie Benutzer, ihn zu überprüfen, besonders wenn sie komplexe Aufgaben ausführen.
Der Modellwähler ist persistent, also machen Sie es sich zur Gewohnheit, zu überprüfen, dass es das Modell ist, das Sie verwenden möchten!
Was passiert, wenn sie ein Limit erreichen
Wenn ein Benutzer sein individuelles Limit erreicht, kann er sich an seinen Gruppenbesitzer oder das IT-/Admin-Team wenden, um eine Erhöhung anzufordern.
Sie verlieren keine laufenden Arbeiten – Claude wird den aktuellen Durchgang abschließen, bevor die weitere Nutzung eingeschränkt wird.
