Claude Enterprise donne à votre organisation accès à une IA puissante via le chat, Claude Code et Claude Cowork. Avec cet accès vient la responsabilité de gérer efficacement la consommation—en veillant à ce que votre équipe obtienne une valeur maximale tout en maintenant une utilisation prévisible et dans le budget.
Ce guide accompagne les administrateurs Enterprise à travers les leviers clés disponibles pour contrôler et optimiser la consommation de tokens : définir des plafonds de dépenses, configurer les contrôles d'accès basés sur les rôles, former les utilisateurs et choisir le bon modèle pour la bonne tâche.
Pourquoi la gestion de la consommation est importante
Claude Enterprise est facturé selon un modèle par siège et basé sur l'utilisation. Le pool de consommation de votre organisation est partagé entre tous les utilisateurs, et certaines surfaces—en particulier Claude Code et Cowork—consomment des tokens à un taux significativement plus élevé que le chat standard.
Les administrateurs qui configurent de manière proactive les limites de dépenses et forment les utilisateurs peuvent réduire les gaspillages et s'assurer que les cas d'usage à forte valeur obtiennent la capacité dont ils ont besoin.
Comprendre l'intensité des tokens sur les différentes surfaces
Surface | Intensité des tokens et ce qui la détermine |
Chat principal | Intensité faible. Conversation standard aller-retour, résumé, rédaction et questions-réponses. L'utilisation de tokens augmente avec la longueur des messages et l'historique de conversation. |
Claude Code | Intensité élevée. Chaque session de codage inclut des invites système, du contexte de fichier, des appels d'outils et un raisonnement multi-tours—plus de tokens par session que le chat. |
Claude Cowork | Intensité élevée. Les flux de travail agentiques, l'exécution de tâches multi-étapes et les Skills génèrent une utilisation intermédiaire significative de tokens qui peut ne pas être visible pour les utilisateurs finaux. |
Conseil administrateur : Définissez les attentes avec votre équipe
Les utilisateurs exécutant des flux de travail Claude Code ou Cowork peuvent ne pas réaliser à quel point leurs sessions consomment beaucoup de tokens. Une seule tâche Cowork ou une session de débogage Claude Code peut consommer beaucoup plus de tokens que le chat. Incluez ce contexte dans tout onboarding utilisateur que vous envoyez.
Contrôles d'accès basés sur les rôles
Les contrôles d'accès basés sur les rôles (RBAC) vous permettent de regrouper les utilisateurs et de gérer leur accès aux surfaces Claude et aux budgets de consommation en tant qu'unité plutôt qu'individuellement. C'est le moyen le plus évolutif de gouverner l'utilisation dans les grandes organisations.
Comment structurer les groupes
Pensez aux groupes en termes de fonction professionnelle et de cas d'usage, pas de hiérarchie organisationnelle. Quelques principes :
Créez des groupes qui correspondent à des modèles d'utilisation distincts, pas à des cases d'organigramme. « Ingénierie » et « Ventes » sont plus utiles que « Amérique du Nord » et « EMEA » pour la gestion de la consommation.
Limitez la prolifération des groupes. Plus de 8–10 groupes devient difficile à gérer. Commencez avec 4–6 et divisez uniquement si les modèles d'utilisation divergent clairement.
Utilisez les groupes pour contrôler l'accès aux surfaces à forte intensité. Par exemple : seuls les membres du groupe « Ingénierie » peuvent accéder à Claude Code ; les autres utilisateurs ne voient que Chat et Cowork.
Attribuez les plafonds de dépenses au niveau du groupe comme point de départ, puis remplacez au niveau de l'utilisateur pour les cas aberrants (par exemple, un PM non technique qui a besoin de Claude Code pour un projet spécifique).
Gestion des dépenses de groupe
Une fois les groupes configurés :
Examinez la consommation du groupe chaque semaine lors du déploiement initial, puis mensuellement par la suite.
Lorsqu'un groupe s'approche régulièrement de son plafond, enquêtez avant d'augmenter automatiquement—la bonne réponse pourrait être une orientation de modèle (utiliser Sonnet au lieu d'Opus) plutôt que plus de budget.
Envisagez d'attribuer un « propriétaire de groupe » dans chaque département responsable de l'examen de l'utilisation et de répondre aux questions de son équipe. Cela distribue la charge administrative et met quelqu'un ayant un contexte métier dans la boucle. Veuillez noter que cela impliquerait de donner à ces personnes des droits d'administrateur, ce qui peut ne pas être souhaité.
Conseil de gouvernance : Utilisez l'accès aux surfaces comme première barrière
Avant de vous préoccuper des limites au niveau des tokens, assurez-vous que les bonnes personnes ont accès aux bonnes surfaces. Donner à tout le monde l'accès à Claude Code et Cowork dès le premier jour est le moyen le plus rapide de générer une consommation inattendue. Déployez les surfaces à forte intensité par vagues, en commençant par les équipes les plus susceptibles de les utiliser de manière productive.
Définir les limites de dépenses
Les limites de dépenses sont votre outil principal pour contrôler la consommation. Claude Enterprise permet aux administrateurs de définir des limites à trois niveaux : le niveau organisationnel, le niveau de groupe (avec RBAC) et le niveau utilisateur individuel. Notre approche recommandée est de commencer par les limites au niveau du groupe RBAC et les limites par utilisateur—celles-ci vous donnent un contrôle précis et ciblé sans le risque de couper toute votre organisation si une limite est atteinte.
Limites de dépenses au niveau organisationnel
La limite au niveau organisationnel est disponible comme plafond absolu pour tous les utilisateurs et surfaces, mais utilisez-la avec prudence : l'atteindre affecte tout le monde simultanément, ce qui peut être perturbateur. La plupart des administrateurs trouvent que la gestion de la consommation au niveau du groupe et de l'utilisateur leur donne de meilleurs résultats avec moins de risque opérationnel.
Limite de dépenses de groupe
Les limites de dépenses de groupe vous permettent d'attribuer une limite de dépenses mensuelle par utilisateur à un groupe entier, de sorte que chaque membre du groupe hérite de la même limite sans la définir individuellement. C'est le moyen le plus évolutif de gérer la consommation dans les organisations de taille moyenne à grande, et c'est par là que les administrateurs devraient commencer.
Notez les règles de précédence suivantes :
Les limites individuelles remplacent toujours les limites de groupe, quel que soit le montant le plus élevé.
Si un utilisateur appartient à plusieurs groupes avec des limites différentes, l'organisation peut appliquer soit la limite de dépenses la plus basse, soit la plus élevée. Utilisez la liste déroulante sous « Paramètres par défaut de dépenses » pour déterminer la précédence que vous souhaitez appliquer. Notez que la limite par défaut du type de siège est également incluse dans cette comparaison.
Les limites à l'échelle de l'organisation restent le plafond absolu.
Aucune limite nulle part = aucune limite. Si un membre n'a pas de limite individuelle et aucun de ses groupes n'a de limite, sa dépense n'est pas plafonnée.
Comment configurer : Paramètres de l'organisation > Utilisation > Par groupe. Définissez les limites sur un montant en dollars spécifique ou « Illimité ».
Plafonds de dépenses au niveau utilisateur
Les plafonds au niveau utilisateur vous permettent de définir des limites de consommation pour les comptes individuels. Ceux-ci sont essentiels pour les organisations où l'utilisation varie considérablement selon les rôles—un développeur utilisant Claude Code quotidiennement a des besoins très différents d'un spécialiste du marketing utilisant le chat pour la rédaction.
Meilleures pratiques pour les plafonds au niveau utilisateur :
Définissez les niveaux de consommation en fonction du type de rôle avant le déploiement. Une structure échelonnée—par exemple, léger, standard, puissant—facilite l'attribution et l'ajustement cohérent des plafonds.
Commencez prudemment. Il est plus facile d'augmenter un plafond en fonction de la demande d'un utilisateur que de revenir sur une conversation de dépassement.
Accordez aux utilisateurs avancés (ingénieurs, data scientists, chercheurs) des limites individuelles plus élevées ou illimitées, mais compensez cela en veillant à ce qu'ils utilisent le bon modèle Claude pour la bonne tâche.
Examinez les rapports d'utilisation individuels mensuellement pour identifier les anomalies—à la fois les utilisateurs qui atteignent régulièrement leur limite (qui pourraient en avoir besoin de plus) et les utilisateurs qui consomment très peu (qui pourraient ne pas être activés encore).
Points de départ recommandés
Type d'utilisateur | Code | Cowork | Chat |
Avancé (Top 10%) | $200 | $100 | $50 |
Typique (Moyenne) | $85 | $50 | $20 |
Léger (Médiane) | $25 | $20 | $5 |
*Ces chiffres sont des estimations approximatives pour la planification. La consommation réelle variera en fonction de la taille de votre équipe, de vos flux de travail et de vos modèles d'utilisation.
Conseils de sélection de modèle
L'une des choses les plus impactantes qu'un administrateur peut faire est de fournir des conseils clairs aux utilisateurs sur le modèle à utiliser pour quelles tâches. Le choix du modèle a un impact direct et significatif sur la consommation de tokens—Opus peut consommer plusieurs fois plus de tokens que Sonnet pour la même tâche.
Le bon modèle pour la bonne tâche
Modèle | Idéal pour | Intensité en tokens | Utilisation recommandée |
Claude Sonnet | Tâches quotidiennes, rédaction, analyse, Q&A | Modérée | Modèle par défaut pour tous les utilisateurs—défini comme modèle par défaut à l'échelle de l'organisation |
Claude Opus | Raisonnement complexe, recherche, tâches multi-étapes | Élevée | Réservé aux utilisateurs avancés ou à des flux de travail spécifiques uniquement |
Claude Haiku | Recherches simples, résumés, réponses rapides | Faible | Tâches d'automatisation légères et à haut volume |
Recommandations de configuration administrateur
Si vous avez des flux de travail à haut volume et faible complexité (par exemple, résumer les tickets de support, générer des brouillons d'e-mails), évaluez si Haiku serait un meilleur choix—cela peut réduire considérablement la consommation pour ces cas d'usage.
Auditez régulièrement les modèles que vos utilisateurs sélectionnent réellement. Si la majorité de votre consommation provient d'Opus, c'est un signal que vos conseils de sélection de modèle ne passent pas.
Ce qu'il faut dire à vos utilisateurs sur le choix du modèle
Sonnet est votre outil quotidien. Il est rapide, très capable, et est conçu pour la grande majorité des tâches—rédaction, analyse, aide à la programmation et Q&A.
Opus est pour le travail plus difficile et plus complexe. Utilisez-le quand vous travaillez sur un problème multi-étapes véritablement complexe, ou quand la qualité importe plus que la vitesse.
En cas de doute, commencez par Sonnet. Vous pouvez toujours changer le modèle en cours de conversation vers Opus si vous avez besoin de plus de profondeur.
Utiliser les préférences organisationnelles pour façonner le comportement des utilisateurs
Les Préférences Organisationnelles permettent aux administrateurs d'injecter des conseils permanents dans chaque conversation Claude au sein de votre organisation—donnant effectivement à Claude une invite système qui reflète les normes, les meilleures pratiques et les garde-fous de votre équipe. C'est un outil à fort effet de levier pour modifier le comportement des utilisateurs sans ajouter de friction, car les conseils apparaissent dans le produit au moment de l'utilisation plutôt que dans la documentation que les utilisateurs doivent trouver.
Quelques façons d'utiliser les Préférences Organisationnelles pour gérer la consommation et les modèles d'utilisation :
Décourager les formats de sortie gourmands en tokens. Si vous avez remarqué une prolifération d'un type d'artefact particulier (par exemple, des tableaux de bord HTML partagés dans des fils de discussion multi-fonctionnels où un format plus simple suffirait), vous pouvez demander à Claude de confirmer avec l'utilisateur avant d'en générer un. Cela ajoute une vérification légère sans supprimer complètement la capacité.
Orientez les utilisateurs vers les ressources internes. Référencez directement le wiki de votre équipe, les documents de bonnes pratiques ou les directives d'utilisation dans la préférence. Claude les affichera quand c'est pertinent—guidant les utilisateurs vers le bon contexte interne au lieu de le réinventer à chaque fois.
Renforcez les normes de sélection de modèle. Rappelez à Claude (et par extension, aux utilisateurs) que Sonnet est le modèle par défaut et Opus est réservé à des flux de travail spécifiques. Cela complète l'éducation des utilisateurs sans exiger que tout le monde l'intériorise dès le départ.
Suivi de l'utilisation et des dépenses
Page Analytics
La page Analytics dans le menu utilisateur (claude.ai/analytics) est le moyen le plus rapide d'avoir une vue d'ensemble de votre organisation. Elle affiche les utilisateurs actifs hebdomadaires, l'utilisation des sièges, les connecteurs principaux, les dépenses totales (MTD/QTD/YTD), les dépenses par modèle et un classement des 10 principaux utilisateurs par dépenses. Les vues spécifiques aux produits pour Claude.ai, Claude Code et Cowork détaillent l'activité pour chaque surface. En savoir plus.
Export du rapport de dépenses en CSV
Si vous avez besoin d'une ventilation détaillée ponctuelle, vous pouvez exporter un rapport de dépenses par utilisateur et par modèle en CSV depuis Analytics > All Activity > Spend > Export Spend. Choisissez MTD, le mois dernier, les 90 derniers jours ou une plage personnalisée jusqu'à 90 jours en arrière. Le CSV inclut l'e-mail de l'utilisateur, l'ID utilisateur, l'UUID du compte, le produit, le modèle, le nombre de requêtes, les jetons d'invite et de complétion, ainsi que les dépenses nettes et brutes en USD.
Chat Analytics
Analytics chat vous permet de poser des questions sur l'utilisation de votre organisation en langage naturel. Tapez une question—« affiche-moi les dépenses quotidiennes des 30 derniers jours », « qui sont nos plus gros dépensiers », « quel est notre taux d'utilisation des sièges »—et Claude retourne un graphique et un court résumé écrit de ce qu'il a trouvé. Vous pouvez faire un suivi pour affiner, approfondir ou pivoter sans recommencer.
Utilisez ceci quand vous avez une question spécifique et que vous ne voulez pas naviguer dans le tableau de bord, ou quand vous explorez des tendances et que vous voulez un échange rapide. Les résultats couvrent les 30 derniers jours par défaut ; spécifiez une plage différente dans votre question si vous en avez besoin. Les données sont actualisées quotidiennement. En savoir plus.
API Analytics
Pour un accès programmatique, utilisez l'API Claude Enterprise Analytics. Extrayez une liste classée d'utilisateurs par jetons utilisés ou dollars dépensés, ou examinez les tendances d'utilisation et de coûts au fil du temps ventilées par produit, modèle, fenêtre de contexte ou région. Chaque requête est limitée à 31 jours, à partir des 365 derniers jours, et pas avant le 1er janvier 2026.
Votre propriétaire principal peut générer une clé API d'administrateur. Les données sont actualisées toutes les quatre heures ; pour les totaux de qualité facturation, interrogez les dates d'il y a 30 jours ou plus afin que les événements tardifs aient le temps de se réconcilier. En savoir plus et consultez le guide de référence de l'API.
Éducation des utilisateurs finaux
Les contrôles technologiques vous mèneront la plupart du chemin, mais le comportement des utilisateurs fait le reste. Une équipe qui comprend comment fonctionne la consommation fera de meilleurs choix indépendamment—et vous présentera moins de cas limites à dépanner.
Ce qu'il faut communiquer aux utilisateurs finaux
Quand vous intégrez les utilisateurs, partagez ce qui suit :
Comment Claude est facturé
L'utilisation est mesurée en jetons. Les invites longues et les conversations longues consomment plus de jetons.
Les sessions Claude Code et Cowork consomment beaucoup plus de jetons que le chat. Une seule session de codage longue peut utiliser beaucoup plus de jetons qu'une session de chat typique.
Vérifiez votre utilisation dans les paramètres en basculant vers Paramètres → Utilisation.
Comment choisir un modèle
Sonnet est le modèle par défaut et gère bien la plupart des tâches. Utilisez Opus uniquement quand Sonnet ne vous mène pas où vous avez besoin d'aller.
Le sélecteur de modèle est visible dans l'interface—rappelez aux utilisateurs de le vérifier, surtout s'ils exécutent des tâches complexes.
Le sélecteur de modèle est persistant, alors faites-en une pratique de vérifier que c'est le modèle que vous voulez utiliser !
Ce qui se passe quand ils atteignent une limite
Si un utilisateur atteint sa limite individuelle, il peut contacter le propriétaire de son groupe ou l'équipe IT/admin pour demander une augmentation.
Ils ne perdront pas le travail en cours—Claude complètera le tour actuel avant de limiter l'utilisation ultérieure.
