Guida al consumo di Claude Enterprise

Claude Enterprise offre alla tua organizzazione accesso a potenti strumenti di IA tramite chat, Claude Code e Claude Cowork. Con questo accesso viene la responsabilità di gestire il consumo in modo efficace, assicurando che il tuo team ottenga il massimo valore mantenendo l'utilizzo prevedibile e nel budget.

Questa guida accompagna gli amministratori Enterprise attraverso i principali strumenti disponibili per controllare e ottimizzare il consumo di token: impostare limiti di spesa, configurare controlli di accesso basati sui ruoli, educare gli utenti e scegliere il modello e il livello di sforzo giusti per il compito giusto.

Perché la gestione del consumo è importante

Claude Enterprise è basato su un modello per-seat e basato sull'utilizzo. Il pool di consumo della tua organizzazione è condiviso tra tutti gli utenti, e alcune superfici—in particolare Claude Code e Cowork—consumano token a un tasso significativamente più elevato rispetto alla chat standard.

Gli amministratori che configurano proattivamente i limiti di spesa e educano gli utenti possono ridurre gli sprechi e garantire che i casi d'uso ad alto valore ottengano la capacità di cui hanno bisogno.

Comprendere l'intensità dei token tra le superfici

Superficie	Intensità dei token e cosa la determina
Chat principale	Intensità inferiore. Conversazione standard bidirezionale, riassunto, redazione e domande e risposte. L'utilizzo dei token scala con la lunghezza del messaggio e la cronologia della conversazione.
Claude Code	Intensità superiore. Ogni sessione di codifica include prompt di sistema, contesto dei file, chiamate di strumenti e ragionamento multi-turno—più token per sessione rispetto alla chat.
Claude Cowork	Intensità superiore. I flussi di lavoro agentici, l'esecuzione di attività multi-step e le Skills generano un significativo utilizzo di token intermedi che potrebbe non essere visibile agli utenti finali.

Suggerimento per amministratori: Imposta le aspettative con il tuo team

Gli utenti che eseguono flussi di lavoro Claude Code o Cowork potrebbero non rendersi conto di quanto siano intensive in termini di token le loro sessioni. Una singola attività Cowork o una sessione di debug Claude Code può consumare molti più token rispetto alla chat. Includi questo contesto in qualsiasi onboarding utente che invii.

Controlli di accesso basati sui ruoli

I controlli di accesso basati sui ruoli (RBAC) ti permettono di raggruppare gli utenti e gestire il loro accesso alle superfici Claude e ai budget di consumo come unità piuttosto che individualmente. Questo è il modo più scalabile per governare l'utilizzo nelle organizzazioni più grandi.

Come strutturare i gruppi

Pensa ai gruppi in termini di funzione lavorativa e caso d'uso, non di gerarchia organizzativa. Alcuni principi:

Crea gruppi che mappano a modelli di utilizzo distinti, non a caselle dell'organigramma. "Ingegneria" e "Vendite" sono più utili di "Nord America" e "EMEA" per la gestione del consumo.
Limita la proliferazione dei gruppi. Più di 8-10 gruppi diventa difficile da gestire. Inizia con 4-6 e dividi solo se i modelli di utilizzo divergono chiaramente.
Usa i gruppi per controllare l'accesso alle superfici ad alta intensità. Ad esempio: solo i membri del gruppo "Ingegneria" possono accedere a Claude Code; gli altri utenti vedono solo Chat e Cowork.
Assegna i limiti di spesa a livello di gruppo come punto di partenza, quindi esegui l'override a livello di utente per i casi anomali (ad es., un PM non tecnico che ha bisogno di Claude Code per un progetto specifico).

Gestione della spesa del gruppo

Una volta configurati i gruppi:

Rivedi il consumo del gruppo settimanalmente durante il rollout iniziale, mensilmente in seguito.
Quando un gruppo si avvicina costantemente al suo limite, indaga prima di aumentarlo automaticamente—la risposta giusta potrebbe essere la guida del modello (usa Sonnet invece di Opus) piuttosto che più budget.
Considera di assegnare un "proprietario del gruppo" in ogni dipartimento responsabile della revisione dell'utilizzo e della risposta alle domande del suo team. Questo distribuisce il carico amministrativo e mette qualcuno con contesto aziendale nel ciclo. Si prega di notare che ciò comporterebbe la concessione di diritti di amministratore a questi individui, il che potrebbe non essere desiderato.

Suggerimento di governance: Usa l'accesso alla superficie come primo gate

Prima di preoccuparti dei limiti a livello di token, assicurati che le persone giuste abbiano accesso alle superfici giuste. Dare a tutti l'accesso a Claude Code e Cowork dal primo giorno è il modo più veloce per generare consumi inaspettati. Distribuisci le superfici ad alta intensità in ondate, iniziando con i team più propensi a utilizzarle in modo produttivo.

Imposta i limiti di spesa

I limiti di spesa sono il tuo strumento principale per controllare il consumo. Claude Enterprise consente agli amministratori di impostare limiti a tre livelli: il livello dell'organizzazione, il livello del gruppo (con RBAC) e il livello del singolo utente. Il nostro approccio consigliato è iniziare con limiti a livello di gruppo RBAC e limiti per utente—questi ti danno un controllo preciso e mirato senza il rischio di tagliare l'intera organizzazione se viene raggiunto un limite.

Limiti di spesa a livello organizzativo

Il limite a livello organizzativo è disponibile come tetto massimo su tutti gli utenti e le superfici, ma usalo con cautela: raggiungerlo colpisce tutti contemporaneamente, il che può essere dirompente. La maggior parte degli amministratori scopre che gestire il consumo a livello di gruppo e utente dà loro risultati migliori con meno rischio operativo.

Limite di spesa del gruppo

I limiti di spesa del gruppo ti permettono di assegnare un limite di spesa mensile per utente a un intero gruppo, quindi ogni membro di quel gruppo eredita lo stesso limite senza impostarlo individualmente. Questo è il modo più scalabile per gestire il consumo nelle organizzazioni medie-grandi, ed è da dove gli amministratori dovrebbero iniziare.

Nota le seguenti regole di precedenza:

I limiti individuali hanno sempre la priorità sui limiti di gruppo, indipendentemente da quale sia più alto.
Se un utente appartiene a più gruppi con limiti diversi, l'impostazione Limite di spesa multi-gruppo sotto Impostazioni predefinite di spesa controlla se si applica il limite superiore o inferiore. Il limite predefinito del tipo di seat è incluso in questo confronto.
I limiti a livello organizzativo rimangono il tetto massimo.
Nessun limite da nessuna parte = nessun limite. Se un membro non ha un limite individuale e nessuno dei suoi gruppi ha un limite, la sua spesa non è limitata.

Come configurare: Impostazioni organizzazione → Utilizzo → Per gruppo. Imposta i limiti su un importo in dollari specifico o "Illimitato".

Limiti di spesa a livello utente

I limiti a livello utente ti permettono di impostare limiti di consumo per account individuali. Questi sono essenziali per le organizzazioni in cui l'utilizzo varia significativamente tra i ruoli—uno sviluppatore che usa Claude Code quotidianamente ha esigenze molto diverse da un marketer che usa la chat per la copywriting.

Best practice per i limiti a livello utente:

Definisci i tier di consumo in base al tipo di ruolo prima del rollout. Una struttura a tier—ad es., leggero, standard, potente—rende più facile assegnare e regolare i limiti in modo coerente.
Inizia in modo conservativo. È più facile aumentare un limite in base alla richiesta di un utente che tornare indietro su una conversazione di eccedenza.
Dai ai power user (ingegneri, data scientist, ricercatori) limiti individuali più alti o illimitati, ma compensa assicurandoti che utilizzino il modello Claude giusto per il compito giusto.
Monitora i rapporti di utilizzo individuale mensilmente per identificare i valori anomali—sia gli utenti che raggiungono costantemente il loro limite (potrebbero averne bisogno di più) che gli utenti che consumano molto poco (potrebbero non essere ancora attivati).

Punti di partenza consigliati

Tipo di utente	Codice	Cowork	Chat
Power (Top 10%)	$500	$100	$90
Tipico (Media)	$215	$40	$30
Leggero (Mediana)	$40	$10	$5

*Queste cifre sono stime di pianificazione approssimative. Il consumo effettivo varierà in base alle dimensioni del tuo team, ai flussi di lavoro e ai modelli di utilizzo.

Guida alla selezione del modello

Una delle cose più impattanti che un amministratore può fare è fornire una guida chiara agli utenti su quale modello utilizzare per quali compiti. La scelta del modello ha un impatto diretto e significativo sul consumo di token—Opus può consumare diversi volte più token di Sonnet per lo stesso compito.

Il livello di sforzo è una seconda leva di consumo. Gli utenti possono scegliere quanto pensiero Claude applica a ogni risposta, e i livelli di sforzo più alti consumano più token di quelli più bassi. Incoraggia gli utenti a riservare lo sforzo massimo solo per i compiti più impegnativi e a utilizzare uno sforzo inferiore per i compiti di routine.

Il modello giusto per il compito giusto

Modello	Migliore per	Intensità di token	Utilizzo consigliato
Claude Fable	Lavoro di codifica agentico di giorni e compiti di ragionamento	Molto alto	Riservalo per il tuo lavoro agentico più complesso e di maggior valore. Prezzi premium e consumo più veloce rispetto a Opus.
Claude Opus	Ragionamento complesso, ricerca, compiti multi-step	Alto	Riservalo solo per i power user o per flussi di lavoro specifici
Claude Sonnet	Compiti quotidiani, scrittura, analisi, domande e risposte	Moderato	Modello predefinito per tutti gli utenti—impostalo come predefinito a livello di organizzazione (vedi sotto)
Claude Haiku	Ricerche semplici, riassunti, risposte veloci	Basso	Compiti di automazione leggera ad alto volume

Imposta il modello predefinito della tua organizzazione (beta)

Oltre a guidare gli utenti verso il modello giusto, puoi impostare il modello con cui iniziano le nuove conversazioni per tutti nella tua organizzazione. Questa è una delle leve di consumo più dirette disponibili—il predefinito determina ciò che la maggior parte degli utenti esegue giorno dopo giorno.

Hai due opzioni:

Consigliato da Anthropic — si aggiorna automaticamente quando vengono lanciati nuovi modelli, quindi la tua organizzazione inizia sempre con il nostro attuale modello di uso generale consigliato senza manutenzione manuale.
Scegli il tuo — imposta un modello specifico come predefinito dell'organizzazione e lo mantiene lì fino a quando non lo modifichi. Usalo quando vuoi standardizzare su un modello noto per la prevedibilità del consumo (ad esempio, impostare Sonnet come predefinito anziché Opus).

Questa impostazione si applica solo a chat e Cowork. I predefiniti del modello Claude Code sono gestiti separatamente tramite impostazioni gestite.

Puoi anche impostare i modelli predefiniti per ruolo tramite Ruoli personalizzati, in modo che diversi gruppi possano iniziare con modelli diversi, ad esempio impostando il tuo gruppo di ingegneria su un modello e il resto dell'organizzazione su un altro. Questo si abbina naturalmente ai gruppi RBAC che hai già configurato (vedi Sezione 2).

Come configurare: Impostazioni organizzazione → Modelli.

Nota: La selezione del modello attuale degli utenti per le nuove conversazioni potrebbe essere cancellata, quindi utilizzeranno il modello predefinito dell'organizzazione nella loro prossima conversazione.

Gestisci l'accesso ai modelli per la tua organizzazione

Oltre a impostare un modello predefinito, puoi limitare quali modelli sono disponibili in generale, un controllo più rigoroso della sola guida. Questo funziona a due livelli:

Livello organizzazione: ogni modello è abilitato o disabilitato per tutti, inclusi Proprietari e Amministratori. La disabilitazione di un modello qui lo rimuove da ogni selettore in tutta l'organizzazione.
Livello ruolo personalizzato: per i membri con ruoli personalizzati, ogni ruolo concede accesso a un sottoinsieme di ciò che è abilitato a livello organizzativo. Un ruolo non può concedere un modello che l'organizzazione ha disabilitato: l'impostazione dell'organizzazione è sempre il limite massimo.

Nota: I modelli Haiku sono sempre disponibili per ogni membro e non possono essere disabilitati, quindi c'è sempre un modello di fallback.

Se un membro appartiene a più gruppi con diversi ruoli personalizzati, l'accesso è additivo: ottiene ogni modello che uno qualsiasi dei suoi ruoli concede (purché sia abilitato a livello organizzativo).

Limitazione del livello di sforzo per ruolo

Oltre a limitare quali modelli un ruolo può utilizzare, puoi limitare il livello di sforzo massimo che i membri di quel ruolo possono selezionare per modello, una versione più granulare della guida di sforzo già trattata sopra. Questo si applica solo ai Ruoli personalizzati, non a livello organizzativo. Se un membro ha più ruoli, vince il limite di sforzo più alto tra quei ruoli.

Suggerimento per amministratori: Abbina restrizioni di modello + sforzo

Se la guida del modello (il messaggio "Sonnet è il tuo modello predefinito") non sta funzionando e stai ancora vedendo un consumo pesante di Opus, limitare l'accesso a Opus a ruoli specifici, oppure limitare lo sforzo a Medio/Alto invece di Massimo per i ruoli non power-user, è la leva successiva. Riserva l'accesso completo ai ruoli dove il ragionamento profondo ha davvero un valore.

Dove si applica

Le restrizioni di accesso ai modelli e di sforzo sono applicate in chat (web, desktop, mobile), Claude Cowork, Office Agents e Claude Code (CLI 2.1.196+: le versioni precedenti mostrano ancora le opzioni limitate ma le richieste che le utilizzano vengono rifiutate). Claude in Chrome, Claude Design e Claude Security non lo supportano ancora.

Come configurare: Impostazioni organizzazione → Ruoli → seleziona un ruolo → scheda Modelli. Imposta l'accesso ai modelli, un limite di sforzo facoltativo per modello e un modello predefinito facoltativo a livello di ruolo. Per gestire la configurazione in tutta l'organizzazione, vai a Impostazioni organizzazione → Modelli. Ulteriori dettagli in Gestisci l'accesso ai modelli per la tua organizzazione.

Raccomandazioni di configurazione per amministratori

Se hai flussi di lavoro ad alto volume e bassa complessità (ad esempio, riassumere i ticket di supporto, generare bozze di email), valuta se Haiku è una scelta migliore: può ridurre significativamente il consumo per questi casi d'uso.
Controlla periodicamente quali modelli i tuoi utenti stanno effettivamente selezionando. Se la maggior parte del tuo consumo è su Opus, è un segnale che la tua guida del modello non sta funzionando.

Cosa dire ai tuoi utenti sulla scelta del modello

Sonnet è il tuo cavallo di battaglia quotidiano. È veloce, altamente capace ed è progettato per la stragrande maggioranza dei compiti: scrittura, analisi, aiuto nella codifica e domande e risposte.

Opus è per il lavoro più difficile e complesso. Usalo quando stai lavorando su un problema multi-step genuinamente complesso, o quando la qualità è più importante della velocità.

In caso di dubbio, inizia con Sonnet. Puoi sempre cambiare il modello a metà conversazione con Opus se hai bisogno di più profondità.

Utilizzo delle preferenze organizzative per modellare il comportamento degli utenti

Le Preferenze organizzative consentono agli amministratori di iniettare una guida permanente in ogni conversazione Claude in tutta l'organizzazione, fornendo effettivamente a Claude un prompt di sistema che riflette le norme, le best practice e i guardrail del tuo team. Questo è uno strumento ad alto impatto per cambiare il comportamento degli utenti senza aggiungere attrito, perché la guida appare nel prodotto al momento dell'uso piuttosto che nella documentazione che gli utenti devono cercare.

Alcuni modi in cui puoi utilizzare le Preferenze organizzative per gestire il consumo e i modelli di utilizzo:

Scoraggia i formati di output ad alta intensità di token. Se hai notato la proliferazione di un particolare tipo di artefatto (ad esempio, dashboard HTML condivise in thread interfunzionali dove un formato più semplice farebbe il lavoro), puoi istruire Claude a confermare con l'utente prima di generarne uno. Questo aggiunge un controllo leggero senza rimuovere completamente la capacità.
Indirizza gli utenti alle risorse interne. Fai riferimento al wiki del tuo team, ai documenti di best practice o alle linee guida di utilizzo direttamente nella preferenza. Claude li farà emergere quando rilevante, indirizzando gli utenti verso il contesto interno giusto invece di reinventarlo ogni volta.
Rinforza le norme di selezione del modello. Ricorda a Claude (e per estensione, agli utenti) che Sonnet è il modello predefinito e Opus è riservato a flussi di lavoro specifici. Questo completa l'educazione degli utenti senza richiedere a tutti di interiorizzarlo in anticipo.

Tracciamento dell'utilizzo e della spesa

Pagina Analytics

La pagina Analytics nel menu utente (claude.ai/analytics) è il modo più veloce per avere una visione della tua organizzazione. Mostra gli utenti attivi settimanali, l'utilizzo dei posti, i principali connettori, la spesa totale (MTD/QTD/YTD), la spesa per modello e una classifica dei primi 10 utenti per spesa. Le visualizzazioni specifiche del prodotto per Claude.ai, Claude Code e Cowork suddividono l'attività per ogni superficie. Ulteriori informazioni.

Esportazione del rapporto di spesa in CSV

Se hai bisogno di una suddivisione dettagliata una tantum, puoi esportare un rapporto di spesa per utente e per modello come CSV da Analytics → All Activity → Spend → Export Spend. Scegli MTD, ultimo mese, ultimi 90 giorni o un intervallo personalizzato fino a 90 giorni fa. Il CSV include email utente, ID utente, UUID account, prodotto, modello, conteggio richieste, token di prompt e completamento e spesa netta e lorda in USD.

Chat Analytics

Analytics chat ti consente di fare domande sull'utilizzo della tua organizzazione in linguaggio naturale. Digita una domanda: "mostrami la spesa giornaliera degli ultimi 30 giorni", "chi sono i nostri maggiori spenditori", "qual è il nostro tasso di utilizzo dei posti", e Claude restituisce un grafico e un breve riassunto scritto di ciò che ha trovato. Puoi fare un follow-up per affinare, approfondire o cambiare direzione senza ricominciare.

Usa questo quando hai una domanda specifica e non vuoi navigare nel dashboard, o quando stai esplorando tendenze e vuoi un dialogo veloce. I risultati coprono gli ultimi 30 giorni per impostazione predefinita; specifica un intervallo diverso nella tua domanda se ne hai bisogno. I dati si aggiornano quotidianamente. Ulteriori informazioni.

API Analytics

Per l'accesso programmatico, utilizza l'API Claude Enterprise Analytics. Estrai un elenco classificato di utenti per token utilizzati o dollari spesi, o guarda le tendenze di utilizzo e costo nel tempo suddivise per prodotto, modello, finestra di contesto o regione. Ogni richiesta è limitata a 31 giorni di larghezza, a partire dagli ultimi 365 giorni, e non prima del 1° gennaio 2026.

Il tuo Proprietario principale può generare una chiave API amministratore. I dati si aggiornano ogni quattro ore; per totali di qualità fatturazione, interroga date 30+ giorni nel passato in modo che gli eventi tardivi abbiano tempo di riconciliarsi. Ulteriori informazioni e rivedi la guida di riferimento API.

Educazione dell'utente finale

I controlli tecnologici ti porteranno per la maggior parte della strada, ma il comportamento degli utenti guida il resto. Un team che comprende come funziona il consumo farà scelte migliori in modo indipendente e farà emergere meno casi limite per te da risolvere.

Cosa comunicare agli utenti finali

Quando onboard gli utenti, condividi quanto segue:

Come viene fatturato Claude

L'utilizzo è misurato in token. I prompt lunghi e le conversazioni lunghe consumano più token.
Le sessioni Claude Code e Cowork sono significativamente più intensive di token rispetto alla chat. Una singola sessione di codifica lunga può utilizzare molti più token di una tipica sessione di chat.
Controlla il tuo utilizzo nelle impostazioni attivando Impostazioni → Utilizzo.

Come scegliere un modello

Sonnet è il modello predefinito e gestisce bene la maggior parte dei compiti. Usa Opus solo quando Sonnet non ti sta portando dove hai bisogno di andare.
La tua organizzazione ha un modello predefinito per le nuove conversazioni; puoi comunque cambiare modello durante la conversazione quando un'attività lo richiede.
Il selettore del modello è visibile nell'interfaccia—ricorda agli utenti di controllarlo, soprattutto se stanno eseguendo attività complesse.
Il selettore del modello è fisso, quindi assicurati di controllare che sia il modello che desideri utilizzare.
Il livello di impegno appare accanto al nome del modello. Un impegno maggiore significa risposte più approfondite ma un consumo di token più elevato, quindi adattalo all'attività.

Cosa succede quando raggiungono un limite

Se un utente raggiunge il suo limite individuale, può contattare il proprietario del gruppo o il team IT/amministrativo per richiedere un aumento.
Non perderanno il lavoro in corso—Claude completerà il turno attuale prima di limitare ulteriormente l'utilizzo.