Claude Enterprise offre alla tua organizzazione accesso a potenti strumenti di IA tramite chat, Claude Code e Claude Cowork. Con questo accesso viene la responsabilità di gestire il consumo in modo efficace, assicurando che il tuo team ottenga il massimo valore mantenendo l'utilizzo prevedibile e nel budget.
Questa guida accompagna gli amministratori Enterprise attraverso i principali strumenti disponibili per controllare e ottimizzare il consumo di token: impostare limiti di spesa, configurare controlli di accesso basati sui ruoli, educare gli utenti e scegliere il modello giusto per il compito giusto.
Perché la gestione del consumo è importante
Claude Enterprise è prezzato su un modello per-seat basato sull'utilizzo. Il pool di consumo della tua organizzazione è condiviso tra tutti gli utenti, e alcune superfici—in particolare Claude Code e Cowork—consumano token a un tasso significativamente più elevato rispetto alla chat standard.
Gli amministratori che configurano proattivamente i limiti di spesa e educano gli utenti possono ridurre gli sprechi e garantire che i casi d'uso ad alto valore ottengano la capacità di cui hanno bisogno.
Comprendere l'intensità dei token tra le superfici
Superficie | Intensità dei token e cosa la determina |
Chat principale | Intensità inferiore. Conversazione standard bidirezionale, riassunto, redazione e domande e risposte. L'utilizzo dei token scala con la lunghezza del messaggio e la cronologia della conversazione. |
Claude Code | Intensità superiore. Ogni sessione di codifica include prompt di sistema, contesto dei file, chiamate di strumenti e ragionamento multi-turno—più token per sessione rispetto alla chat. |
Claude Cowork | Intensità superiore. I flussi di lavoro agentici, l'esecuzione di attività multi-step e le Skills generano un significativo utilizzo di token intermedi che potrebbe non essere visibile agli utenti finali. |
Suggerimento per amministratori: Imposta le aspettative con il tuo team
Gli utenti che eseguono flussi di lavoro Claude Code o Cowork potrebbero non rendersi conto di quanto siano intensive in termini di token le loro sessioni. Una singola attività Cowork o una sessione di debug Claude Code può consumare molti più token rispetto alla chat. Includi questo contesto in qualsiasi onboarding utente che invii.
Controlli di accesso basati sui ruoli
I controlli di accesso basati sui ruoli (RBAC) ti permettono di raggruppare gli utenti e gestire il loro accesso alle superfici Claude e ai budget di consumo come unità piuttosto che individualmente. Questo è il modo più scalabile per governare l'utilizzo nelle organizzazioni più grandi.
Come strutturare i gruppi
Pensa ai gruppi in termini di funzione lavorativa e caso d'uso, non di gerarchia organizzativa. Alcuni principi:
Crea gruppi che mappano a modelli di utilizzo distinti, non a caselle dell'organigramma. "Ingegneria" e "Vendite" sono più utili di "Nord America" e "EMEA" per la gestione del consumo.
Limita la proliferazione dei gruppi. Più di 8-10 gruppi diventa difficile da gestire. Inizia con 4-6 e dividi solo se i modelli di utilizzo divergono chiaramente.
Usa i gruppi per controllare l'accesso alle superfici ad alta intensità. Ad esempio: solo i membri del gruppo "Ingegneria" possono accedere a Claude Code; gli altri utenti vedono solo Chat e Cowork.
Assegna i limiti di spesa a livello di gruppo come punto di partenza, quindi esegui l'override a livello di utente per i casi anomali (ad es., un PM non tecnico che ha bisogno di Claude Code per un progetto specifico).
Gestione della spesa del gruppo
Una volta configurati i gruppi:
Rivedi il consumo del gruppo settimanalmente durante il rollout iniziale, mensilmente in seguito.
Quando un gruppo si avvicina costantemente al suo limite, indaga prima di aumentarlo automaticamente—la risposta giusta potrebbe essere la guida del modello (usa Sonnet invece di Opus) piuttosto che più budget.
Considera di assegnare un "proprietario del gruppo" in ogni dipartimento responsabile della revisione dell'utilizzo e della risposta alle domande del suo team. Questo distribuisce il carico amministrativo e mette qualcuno con contesto aziendale nel ciclo. Si prega di notare che ciò comporterebbe la concessione di diritti di amministratore a questi individui, il che potrebbe non essere desiderato.
Suggerimento di governance: Usa l'accesso alla superficie come primo gate
Prima di preoccuparti dei limiti a livello di token, assicurati che le persone giuste abbiano accesso alle superfici giuste. Dare a tutti l'accesso a Claude Code e Cowork dal primo giorno è il modo più veloce per generare un consumo inaspettato. Distribuisci le superfici ad alta intensità in ondate, iniziando con i team più propensi a utilizzarle in modo produttivo.
Imposta i limiti di spesa
I limiti di spesa sono il tuo strumento principale per controllare il consumo. Claude Enterprise consente agli amministratori di impostare limiti a tre livelli: il livello dell'organizzazione, il livello del gruppo (con RBAC) e il livello del singolo utente. Il nostro approccio consigliato è iniziare con limiti a livello di gruppo RBAC e limiti per utente—questi ti danno un controllo preciso e mirato senza il rischio di tagliare l'intera organizzazione se viene raggiunto un limite.
Limiti di spesa a livello organizzativo
Il limite a livello organizzativo è disponibile come tetto massimo su tutti gli utenti e le superfici, ma usalo con cautela: raggiungerlo colpisce tutti contemporaneamente, il che può essere dirompente. La maggior parte degli amministratori scopre che gestire il consumo a livello di gruppo e utente dà loro risultati migliori con meno rischio operativo.
Limite di spesa del gruppo
I limiti di spesa del gruppo ti permettono di assegnare un limite di spesa mensile per utente a un intero gruppo, quindi ogni membro di quel gruppo eredita lo stesso limite senza impostarlo individualmente. Questo è il modo più scalabile per gestire il consumo nelle organizzazioni medie-grandi, ed è da dove gli amministratori dovrebbero iniziare.
Nota le seguenti regole di precedenza:
I limiti individuali hanno sempre la priorità sui limiti di gruppo, indipendentemente da quale sia più alto.
Se un utente appartiene a più gruppi con limiti diversi, l'organizzazione può applicare il limite di spesa più basso o più alto. Usa il menu a discesa sotto "Impostazioni predefinite di spesa" per determinare la precedenza che desideri applicare. Nota che il limite predefinito del tipo di seat è incluso anche in questo confronto.
I limiti a livello organizzativo rimangono il tetto massimo.
Nessun limite da nessuna parte = nessun limite. Se un membro non ha un limite individuale e nessuno dei suoi gruppi ha un limite, la sua spesa non è limitata.
Come configurare: Impostazioni organizzazione > Utilizzo > Per gruppo. Imposta i limiti su un importo in dollari specifico o "Illimitato".
Limiti di spesa a livello utente
I limiti a livello utente ti permettono di impostare limiti di consumo per account individuali. Questi sono essenziali per le organizzazioni in cui l'utilizzo varia significativamente tra i ruoli—uno sviluppatore che usa Claude Code quotidianamente ha esigenze molto diverse da un addetto al marketing che usa la chat per la copywriting.
Best practice per i limiti a livello utente:
Definisci i livelli di consumo in base al tipo di ruolo prima del rollout. Una struttura a livelli—ad es., leggero, standard, potente—rende più facile assegnare e regolare i limiti in modo coerente.
Inizia in modo conservativo. È più facile aumentare un limite in base alla richiesta di un utente che tornare indietro su una conversazione di eccedenza.
Dai ai power user (ingegneri, data scientist, ricercatori) limiti individuali più alti o illimitati, ma compensa questo assicurandoti che utilizzino il modello Claude giusto per il compito giusto.
Monitora i rapporti di utilizzo individuale mensilmente per identificare i valori anomali—sia gli utenti che raggiungono costantemente il loro limite (potrebbero averne bisogno di più) che gli utenti che consumano molto poco (potrebbero non essere ancora attivati).
Punti di partenza consigliati
Tipo di utente | Codice | Cowork | Chat |
Power (Top 10%) | $200 | $100 | $50 |
Tipico (Media) | $85 | $50 | $20 |
Leggero (Mediana) | $25 | $20 | $5 |
*Queste cifre sono stime di pianificazione approssimative. Il consumo effettivo varierà in base alle dimensioni del tuo team, ai flussi di lavoro e ai modelli di utilizzo.
Guida alla selezione del modello
Una delle cose più impattanti che un amministratore può fare è fornire una guida chiara agli utenti su quale modello utilizzare per quali compiti. La scelta del modello ha un impatto diretto e significativo sul consumo di token—Opus può consumare diversi volte più token di Sonnet per lo stesso compito.
Il modello giusto per il compito giusto
Modello | Ideale per | Intensità di token | Utilizzo consigliato |
Claude Sonnet | Compiti quotidiani, scrittura, analisi, domande e risposte | Moderato | Modello predefinito per tutti gli utenti—impostato come predefinito a livello organizzativo |
Claude Opus | Ragionamento complesso, ricerca, compiti multi-step | Alto | Riservato solo ai power user o a flussi di lavoro specifici |
Claude Haiku | Ricerche semplici, riassunti, risposte rapide | Basso | Compiti di automazione ad alto volume e leggeri |
Raccomandazioni di configurazione amministrativa
Se hai flussi di lavoro ad alto volume e bassa complessità (ad es., riassumere i ticket di supporto, generare bozze di email), valuta se Haiku è una scelta migliore—può ridurre significativamente il consumo per questi casi d'uso.
Controlla periodicamente quali modelli i tuoi utenti stanno effettivamente selezionando. Se la maggior parte del tuo consumo è su Opus, è un segnale che la tua guida sui modelli non sta funzionando.
Cosa dire ai tuoi utenti sulla scelta del modello
Sonnet è il tuo strumento quotidiano. È veloce, altamente capace, ed è progettato per la stragrande maggioranza dei compiti—scrittura, analisi, aiuto nella codifica e domande e risposte.
Opus è per il lavoro più difficile e complesso. Usalo quando stai lavorando su un problema multi-step genuinamente complesso, o quando la qualità è più importante della velocità.
In caso di dubbio, inizia con Sonnet. Puoi sempre cambiare il modello a metà conversazione con Opus se hai bisogno di più profondità.
Utilizzo delle preferenze organizzative per modellare il comportamento degli utenti
Le Preferenze Organizzative consentono agli amministratori di iniettare una guida permanente in ogni conversazione Claude in tutta l'organizzazione—fornendo effettivamente a Claude un system prompt che riflette le norme, le best practice e i guardrail del tuo team. Questo è uno strumento ad alto impatto per cambiare il comportamento degli utenti senza aggiungere attrito, perché la guida appare nel prodotto al momento dell'uso piuttosto che nella documentazione che gli utenti devono cercare.
Alcuni modi in cui puoi utilizzare le Preferenze Organizzative per gestire il consumo e i modelli di utilizzo:
Scoraggia i formati di output ad alta intensità di token. Se hai notato la proliferazione di un particolare tipo di artefatto (ad es., dashboard HTML condivisi in thread cross-funzionali dove un formato più semplice farebbe il lavoro), puoi istruire Claude a confermare con l'utente prima di generarne uno. Questo aggiunge un controllo leggero senza rimuovere completamente la capacità.
Indirizza gli utenti verso risorse interne. Fai riferimento al wiki del tuo team, ai documenti sulle best practice o alle linee guida di utilizzo direttamente nella preferenza. Claude li farà emergere quando rilevanti, indirizzando gli utenti verso il contesto interno corretto invece di reinventarlo ogni volta.
Rinforza le norme di selezione del modello. Ricorda a Claude (e per estensione agli utenti) che Sonnet è il modello predefinito e Opus è riservato a flussi di lavoro specifici. Questo completa l'educazione degli utenti senza richiedere a tutti di interiorizzarlo fin dall'inizio.
Tracciamento dell'utilizzo e della spesa
Pagina Analytics
La pagina Analytics nel menu utente (claude.ai/analytics) è il modo più veloce per avere una visione della tua organizzazione. Mostra gli utenti attivi settimanali, l'utilizzo dei posti, i connettori principali, la spesa totale (MTD/QTD/YTD), la spesa per modello e una classifica dei 10 utenti principali per spesa. Le visualizzazioni specifiche del prodotto per Claude.ai, Claude Code e Cowork suddividono l'attività per ogni superficie. Scopri di più.
Esportazione CSV del rapporto di spesa
Se hai bisogno di una suddivisione dettagliata una tantum, puoi esportare un rapporto di spesa per utente e per modello come CSV da Analytics > All Activity > Spend > Export Spend. Scegli MTD, ultimo mese, ultimi 90 giorni o un intervallo personalizzato fino a 90 giorni fa. Il CSV include l'email dell'utente, l'ID utente, l'UUID dell'account, il prodotto, il modello, il numero di richieste, i token di prompt e completion, e la spesa netta e lorda in USD.
Analytics chat
Analytics chat ti permette di fare domande sull'utilizzo della tua organizzazione in linguaggio naturale. Digita una domanda—"mostrami la spesa giornaliera degli ultimi 30 giorni," "chi sono i nostri maggiori spenditori," "qual è il nostro tasso di utilizzo dei posti"—e Claude restituisce un grafico e un breve riassunto scritto di ciò che ha trovato. Puoi fare domande di follow-up per affinare, approfondire o cambiare prospettiva senza ricominciare da capo.
Usa questo quando hai una domanda specifica e non vuoi navigare il dashboard, o quando stai esplorando tendenze e vuoi un dialogo veloce. I risultati coprono gli ultimi 30 giorni per impostazione predefinita; specifica un intervallo diverso nella tua domanda se ne hai bisogno. I dati si aggiornano quotidianamente. Scopri di più.
API Analytics
Per l'accesso programmatico, utilizza l'API Claude Enterprise Analytics. Estrai un elenco classificato di utenti per token utilizzati o dollari spesi, oppure esamina le tendenze di utilizzo e costo nel tempo suddivise per prodotto, modello, finestra di contesto o regione. Ogni richiesta è limitata a 31 giorni, a partire dagli ultimi 365 giorni, e non prima del 1° gennaio 2026.
Il tuo Primary Owner può generare una chiave API admin. I dati si aggiornano ogni quattro ore; per totali di qualità fatturazione, interroga date di 30+ giorni nel passato in modo che gli eventi tardivi abbiano tempo di riconciliarsi. Scopri di più e consulta la guida di riferimento dell'API.
Educazione dell'utente finale
I controlli tecnologici ti porteranno a metà strada, ma il comportamento degli utenti guida il resto. Un team che comprende come funziona il consumo farà scelte migliori in modo indipendente e ti presenterà meno casi limite da risolvere.
Cosa comunicare agli utenti finali
Quando onboard gli utenti, condividi quanto segue:
Come viene fatturato Claude
L'utilizzo è misurato in token. I prompt lunghi e le conversazioni lunghe consumano più token.
Le sessioni Claude Code e Cowork sono significativamente più intensive in termini di token rispetto alla chat. Una singola sessione di codifica lunga può utilizzare molti più token di una tipica sessione di chat.
Controlla il tuo utilizzo nelle impostazioni attivando Impostazioni → Utilizzo.
Come scegliere un modello
Sonnet è il modello predefinito e gestisce bene la maggior parte dei compiti. Usa Opus solo quando Sonnet non ti porta dove hai bisogno di andare.
Il selettore del modello è visibile nell'interfaccia—ricorda agli utenti di controllarlo, soprattutto se stanno eseguendo compiti complessi.
Il selettore del modello è persistente, quindi fai in modo che sia una pratica controllare che sia il modello che vuoi usare!
Cosa succede quando raggiungono un limite
Se un utente raggiunge il suo limite individuale, può contattare il proprietario del gruppo o il team IT/admin per richiedere un aumento.
Non perderanno il lavoro in corso—Claude completerà il turno corrente prima di limitare ulteriormente l'utilizzo.
