Guia de consumo do Claude Enterprise

Claude Enterprise oferece à sua organização acesso a IA poderosa em chat, Claude Code e Claude Cowork. Com esse acesso vem a responsabilidade de gerenciar o consumo de forma eficaz—garantindo que sua equipe obtenha o máximo valor mantendo o uso previsível e dentro do orçamento.

Este guia orienta administradores Enterprise através das principais alavancas disponíveis para controlar e otimizar o consumo de tokens: definir limites de gastos, configurar controles de acesso baseados em funções, educar usuários e escolher o modelo e nível de esforço certos para a tarefa certa.

Por que o gerenciamento de consumo é importante

Claude Enterprise é precificado em um modelo por assento com base em uso. O pool de consumo da sua organização é compartilhado entre todos os usuários, e algumas superfícies—particularmente Claude Code e Cowork—consomem tokens a uma taxa significativamente mais alta do que o chat padrão.

Administradores que configuram proativamente limites de gastos e educam usuários podem reduzir desperdícios e garantir que casos de uso de alto valor obtenham a capacidade de que precisam.

Compreendendo a intensidade de tokens entre superfícies

Superfície	Intensidade de tokens e o que a impulsiona
Chat Principal	Intensidade mais baixa. Conversa padrão de ida e volta, resumo, redação e P&R. O uso de tokens escala com o comprimento da mensagem e o histórico de conversa.
Claude Code	Intensidade mais alta. Cada sessão de codificação inclui prompts do sistema, contexto de arquivo, chamadas de ferramentas e raciocínio multi-turno—mais tokens por sessão do que chat.
Claude Cowork	Intensidade mais alta. Fluxos de trabalho agênticos, execução de tarefas em várias etapas e Skills geram uso significativo de tokens intermediários que podem não ser visíveis aos usuários finais.

Dica do administrador: Defina expectativas com sua equipe

Usuários executando fluxos de trabalho Claude Code ou Cowork podem não perceber o quão intensivos em tokens suas sessões são. Uma única tarefa Cowork ou sessão de depuração Claude Code pode consumir muito mais tokens do que chat. Inclua esse contexto em qualquer integração de usuário que você enviar.

Controles de acesso baseados em funções

Controles de acesso baseados em funções (RBAC) permitem agrupar usuários e gerenciar seu acesso às superfícies Claude e orçamentos de consumo como uma unidade em vez de individualmente. Esta é a forma mais escalável de governar o uso em organizações maiores.

Como estruturar grupos

Pense em grupos em termos de função de trabalho e caso de uso, não hierarquia organizacional. Alguns princípios:

Crie grupos que mapeiem padrões de uso distintos, não caixas de organograma. "Engenharia" e "Vendas" são mais úteis do que "América do Norte" e "EMEA" para gerenciamento de consumo.
Limite a proliferação de grupos. Mais de 8–10 grupos fica difícil de gerenciar. Comece com 4–6 e divida apenas se os padrões de uso divergirem claramente.
Use grupos para controlar o acesso a superfícies de alta intensidade. Por exemplo: apenas membros do grupo "Engenharia" podem acessar Claude Code; outros usuários veem apenas Chat e Cowork.
Atribua limites de gastos no nível do grupo como ponto de partida, depois substitua no nível do usuário para exceções (por exemplo, um PM não técnico que precisa de Claude Code para um projeto específico).

Gerenciamento de gastos do grupo

Depois que os grupos são configurados:

Revise o consumo do grupo semanalmente durante o lançamento inicial, mensalmente depois.
Quando um grupo se aproxima consistentemente de seu limite, investigue antes de aumentá-lo automaticamente—a resposta correta pode ser orientação de modelo (use Sonnet em vez de Opus) em vez de mais orçamento.
Considere atribuir um "proprietário do grupo" em cada departamento responsável por revisar o uso e responder perguntas de sua equipe. Isso distribui a carga administrativa e coloca alguém com contexto comercial no loop. Observe que isso envolveria fornecer a esses indivíduos direitos de administrador, o que pode não ser desejado.

Dica de governança: Superfície de acesso como primeiro portão

Antes de se preocupar com limites no nível de tokens, certifique-se de que as pessoas certas têm acesso às superfícies certas. Dar a todos acesso a Claude Code e Cowork no primeiro dia é a forma mais rápida de gerar consumo inesperado. Implante superfícies de maior intensidade em ondas, começando com as equipes mais propensas a usá-las produtivamente.

Defina limites de gastos

Limites de gastos são sua ferramenta principal para controlar o consumo. Claude Enterprise permite que administradores definam limites em três níveis: nível organizacional, nível de grupo (com RBAC) e nível de usuário individual. Nossa abordagem recomendada é começar com limites no nível de grupo RBAC e limites por usuário—estes lhe dão controle preciso e direcionado sem o risco de cortar toda a sua organização se um limite for atingido.

Limites de gastos no nível organizacional

O limite no nível organizacional está disponível como um teto rígido em todos os usuários e superfícies, mas use-o com cuidado: atingi-lo afeta todos simultaneamente, o que pode ser disruptivo. A maioria dos administradores acha que gerenciar o consumo no nível de grupo e usuário oferece melhores resultados com menos risco operacional.

Limite de gastos do grupo

Limites de gastos do grupo permitem atribuir um limite de gastos mensal por usuário a um grupo inteiro, para que cada membro desse grupo herde o mesmo limite sem defini-lo individualmente. Esta é a forma mais escalável de gerenciar o consumo em organizações médias a grandes, e é onde os administradores devem começar.

Observe as seguintes regras de precedência:

Limites individuais sempre substituem limites de grupo, independentemente de qual é maior.
Se um usuário pertence a vários grupos com limites diferentes, a configuração Limite de gastos de vários grupos em Padrões de gastos controla se o limite superior ou inferior se aplica. O limite padrão do tipo de assento está incluído nesta comparação.
Limites em toda a organização permanecem o teto rígido.
Sem limite em lugar nenhum = sem limite. Se um membro não tiver limite individual e nenhum de seus grupos tiver limite, seu gasto não será limitado.

Como configurar: Configurações da organização → Uso → Por grupo. Defina limites para um valor em dólar específico ou "Ilimitado."

Limites de gastos no nível do usuário

Limites no nível do usuário permitem definir limites de consumo para contas individuais. Estes são essenciais para organizações onde o uso varia significativamente entre funções—um desenvolvedor usando Claude Code diariamente tem necessidades muito diferentes de um profissional de marketing usando chat para redação de cópias.

Melhores práticas para limites no nível do usuário:

Defina camadas de consumo com base no tipo de função antes do lançamento. Uma estrutura em camadas—por exemplo, leve, padrão, potência—facilita a atribuição e ajuste consistente de limites.
Comece conservadoramente. É mais fácil aumentar um limite com base na solicitação de um usuário do que reverter uma conversa de excesso.
Conceda aos usuários avançados (engenheiros, cientistas de dados, pesquisadores) limites individuais mais altos ou ilimitados, mas compense isso garantindo que usem o modelo Claude correto para a tarefa correta.
Monitore relatórios de uso individual mensalmente para identificar outliers—tanto usuários que consistentemente atingem seu limite (podem precisar de mais) quanto usuários consumindo muito pouco (podem ainda não estar ativados).

Pontos de partida recomendados

Tipo de usuário	Código	Cowork	Chat
Avançado (Top 10%)	$500	$100	$90
Típico (Média)	$215	$40	$30
Leve (Mediana)	$40	$10	$5

*Estes valores são estimativas aproximadas de planejamento. O consumo real variará conforme o tamanho da sua equipe, fluxos de trabalho e padrões de uso.

Orientação de seleção de modelo

Uma das coisas mais impactantes que um administrador pode fazer é estabelecer orientações claras para os usuários sobre qual modelo usar para quais tarefas. A escolha do modelo tem um impacto direto e significativo no consumo de tokens—Opus pode consumir várias vezes mais tokens que Sonnet para a mesma tarefa.

O nível de esforço é uma segunda alavanca de consumo. Os usuários podem escolher quanto pensamento Claude aplica a cada resposta, e níveis de esforço mais altos consomem mais tokens que os mais baixos. Incentive os usuários a reservar esforço máximo apenas para as tarefas mais exigentes e usar esforço menor para tarefas rotineiras.

O modelo correto para a tarefa correta

Modelo	Melhor para	Intensidade de tokens	Uso recomendado
Claude Fable	Trabalho de codificação agêntica de longa duração e tarefas de raciocínio	Muito Alto	Reserve para seu trabalho agêntico mais valioso e complexo. Preço premium e consumo mais rápido que Opus.
Claude Opus	Raciocínio complexo, pesquisa, tarefas multi-etapas	Alto	Reserve apenas para usuários avançados ou fluxos de trabalho específicos
Claude Sonnet	Tarefas cotidianas, redação, análise, P&R	Moderado	Modelo padrão para todos os usuários—defina como padrão em toda a organização (veja abaixo)
Claude Haiku	Buscas simples, resumos, respostas rápidas	Baixo	Tarefas de automação leve e alto volume

Defina o modelo padrão da sua organização (beta)

Além de orientar os usuários para o modelo correto, você pode definir o modelo com o qual novas conversas começam para todos na sua organização. Esta é uma das alavancas de consumo mais diretas disponíveis—o padrão molda o que a maioria dos usuários executa diariamente.

Você tem duas opções:

Recomendado pela Anthropic — atualiza automaticamente conforme novos modelos são lançados, para que sua organização sempre comece com nosso modelo de uso geral recomendado atualmente sem manutenção manual.
Escolha a sua — define um modelo específico como padrão da organização e o mantém lá até você alterá-lo. Use isso quando quiser padronizar em um modelo conhecido para previsibilidade de consumo (por exemplo, usar Sonnet em vez de Opus como padrão).

Esta configuração se aplica apenas a chat e Cowork. Os padrões de modelo do Claude Code são gerenciados separadamente através de configurações gerenciadas.

Você também pode definir padrões de modelo por função através de Funções Personalizadas, para que diferentes grupos possam começar com modelos diferentes—por exemplo, definindo seu grupo de engenharia para um modelo e o resto da organização para outro. Isso funciona naturalmente com os grupos RBAC que você já configurou (veja a Seção 2).

Como configurar: Configurações da organização → Modelos.

Observação: A seleção de modelo atual dos usuários para novas conversas pode ser limpa, então eles usarão o padrão da organização na próxima conversa.

Gerenciar acesso a modelos para sua organização

Além de definir um padrão, você pode restringir quais modelos estão disponíveis—um controle mais firme do que apenas orientação. Isso funciona em dois níveis:

Nível da organização: cada modelo é habilitado ou desabilitado para todos, incluindo Proprietários e Administradores. Desabilitar um modelo aqui o remove de todos os seletores em toda a organização.
Nível de função personalizada: para membros em funções personalizadas, cada função concede acesso a um subconjunto do que está habilitado no nível da organização. Uma função não pode conceder um modelo que a organização desabilitou—a configuração da organização é sempre o limite máximo.

Observação: Os modelos Haiku estão sempre disponíveis para todos os membros e não podem ser desabilitados, então sempre há um modelo de fallback.

Se um membro pertence a vários grupos com diferentes funções personalizadas, o acesso é aditivo—ele obtém todos os modelos que qualquer uma de suas funções concede (desde que estejam habilitados em toda a organização).

Limitando o nível de esforço por função

Além de restringir quais modelos uma função pode usar, você pode limitar o nível máximo de esforço que os membros dessa função podem selecionar por modelo—uma versão mais granular da orientação de esforço já abordada acima. Isso se aplica apenas a funções personalizadas, não no nível da organização. Se um membro tem várias funções, o limite de esforço mais alto entre essas funções vence.

Dica do administrador: Combine restrições de modelo + esforço

Se a orientação de modelo (a mensagem "Sonnet é seu padrão") não está funcionando e você ainda está vendo alto consumo de Opus, restringir o acesso a Opus para funções específicas—ou limitar o esforço a Médio/Alto em vez de Máximo para funções de usuários não avançados—é o próximo controle. Reserve acesso total para as funções onde o raciocínio profundo realmente compensa.

Onde isso se aplica

As restrições de acesso a modelos e esforço são aplicadas em chat (web, desktop, mobile), Claude Cowork, Office Agents e Claude Code (CLI 2.1.196+—versões anteriores ainda mostram opções restritas, mas solicitações que as usam são rejeitadas). Claude no Chrome, Claude Design e Claude Security ainda não suportam isso.

Como configurar: Configurações da organização → Funções → selecione uma função → aba Modelos. Defina o acesso a modelos, um limite de esforço opcional por modelo e um modelo padrão opcional no nível da função. Para gerenciar a configuração em toda a organização, vá para Configurações da organização → Modelos. Mais detalhes em Gerenciar acesso a modelos para sua organização.

Recomendações de configuração do administrador

Se você tem fluxos de trabalho de alto volume e baixa complexidade (por exemplo, resumir tickets de suporte, gerar rascunhos de e-mails), avalie se Haiku é uma opção melhor—pode reduzir significativamente o consumo para esses casos de uso.
Audite periodicamente quais modelos seus usuários estão realmente selecionando. Se a maioria do seu consumo é em Opus, isso é um sinal de que sua orientação de modelo não está funcionando.

O que dizer aos seus usuários sobre escolha de modelo

Sonnet é seu modelo padrão. É rápido, altamente capaz e foi projetado para a grande maioria das tarefas—escrita, análise, ajuda com codificação e perguntas e respostas.

Opus é para trabalhos mais difíceis e complexos. Use-o quando você está trabalhando em um problema genuinamente complexo com múltiplas etapas, ou quando a qualidade importa mais do que a velocidade.

Em caso de dúvida, comece com Sonnet. Você sempre pode mudar o modelo durante a conversa para Opus se precisar de mais profundidade.

Usando preferências da organização para moldar o comportamento do usuário

As Preferências da Organização permitem que administradores injetem orientação permanente em todas as conversas do Claude em sua organização—efetivamente dando ao Claude um prompt de sistema que reflete as normas, melhores práticas e diretrizes da sua equipe. Esta é uma ferramenta de alto impacto para mudar o comportamento do usuário sem adicionar atrito, porque a orientação aparece no produto no momento do uso em vez de em documentação que os usuários precisam procurar.

Algumas maneiras pelas quais você pode usar Preferências da Organização para gerenciar consumo e padrões de uso:

Desestimule formatos de saída intensivos em tokens. Se você notou proliferação de um tipo de artefato específico (por exemplo, dashboards HTML sendo compartilhados em threads multifuncionais onde um formato mais simples seria suficiente), você pode instruir o Claude a confirmar com o usuário antes de gerar um. Isso adiciona uma verificação leve sem remover a capacidade completamente.
Direcione usuários para recursos internos. Referencie a wiki da sua equipe, documentos de melhores práticas ou diretrizes de uso diretamente na preferência. O Claude os exibirá quando relevante—direcionando usuários para o contexto interno correto em vez de reinventá-lo a cada vez.
Reforce normas de seleção de modelo. Lembre ao Claude (e por extensão, aos usuários) que Sonnet é o padrão e Opus é reservado para fluxos de trabalho específicos. Isso complementa a educação do usuário sem exigir que todos o internalizem antecipadamente.

Rastreando uso e gastos

Página de Análise

A página de Análise dentro do menu do usuário (claude.ai/analytics) é a forma mais rápida de ter uma visão geral da sua organização. Ela mostra usuários ativos semanalmente, utilização de assentos, principais conectores, gasto total (MTD/QTD/YTD), gasto por modelo e um ranking dos 10 principais usuários por gasto. Visualizações específicas do produto para Claude.ai, Claude Code e Cowork detalham a atividade de cada superfície. Saiba mais.

Exportação de relatório de gastos em CSV

Se você precisar de um detalhamento detalhado único, pode exportar um relatório de gasto por usuário e por modelo como CSV de Análise → Toda Atividade → Gastos → Exportar Gastos. Escolha MTD, mês passado, últimos 90 dias ou um intervalo personalizado até 90 dias atrás. O CSV inclui email do usuário, ID do usuário, UUID da conta, produto, modelo, contagem de solicitações, tokens de prompt e conclusão e gasto líquido e bruto em USD.

Chat de Análise

O Chat de Análise permite que você faça perguntas sobre o uso da sua organização em linguagem natural. Digite uma pergunta—"mostre-me o gasto diário dos últimos 30 dias," "quem são nossos maiores gastadores," "qual é nossa taxa de utilização de assentos"—e o Claude retorna um gráfico e um breve resumo escrito do que encontrou. Você pode fazer perguntas de acompanhamento para refinar, aprofundar ou mudar de direção sem começar do zero.

Use isso quando você tem uma pergunta específica e não quer navegar no painel, ou quando está explorando tendências e quer uma troca rápida. Os resultados cobrem os últimos 30 dias por padrão; especifique um intervalo diferente em sua pergunta se precisar. Os dados são atualizados diariamente. Saiba mais.

API de Análise

Para acesso programático, use a API de Análise do Claude Enterprise. Obtenha uma lista classificada de usuários por tokens usados ou dólares gastos, ou veja tendências de uso e custo ao longo do tempo divididas por produto, modelo, janela de contexto ou região. Cada solicitação é limitada a 31 dias de largura, começando nos últimos 365 dias, e não antes de 1º de janeiro de 2026.

Seu Proprietário Principal pode gerar uma chave de API de administrador. Os dados são atualizados a cada quatro horas; para totais de qualidade de faturamento, consulte datas 30+ dias no passado para que eventos tardios tenham tempo para reconciliação. Saiba mais e revise o guia de referência da API.

Educação do usuário final

Os controles tecnológicos o levarão a maior parte do caminho, mas o comportamento do usuário impulsiona o resto. Uma equipe que entende como o consumo funciona fará melhores escolhas independentemente—e apresentará menos casos extremos para você solucionar.

O que comunicar aos usuários finais

Quando você integra usuários, compartilhe o seguinte:

Como o Claude é cobrado

O uso é medido em tokens. Prompts longos e conversas longas consomem mais tokens.
As sessões do Claude Code e Cowork consomem significativamente mais tokens do que o chat. Uma única sessão de codificação longa pode usar muito mais tokens do que uma sessão de chat típica.
Verifique seu uso nas configurações alternando para Configurações → Uso.

Como escolher um modelo

Sonnet é o padrão e lida bem com a maioria das tarefas. Use Opus apenas quando Sonnet não está o levando aonde você precisa ir.
Sua organização tem um modelo padrão definido para novas conversas; você ainda pode alternar entre modelos durante a conversa quando uma tarefa exigir.
O seletor de modelo é visível na interface—lembre os usuários de verificá-lo, especialmente se estiverem executando tarefas complexas.
O seletor de modelo é fixo, então faça uma prática de verificar se é o modelo que você deseja usar.
O nível de esforço aparece ao lado do nome do modelo. Maior esforço significa respostas mais completas, mas maior consumo de tokens, então adapte-o à tarefa.

O que acontece quando eles atingem um limite

Se um usuário atingir seu limite individual, ele pode entrar em contato com o proprietário do grupo ou com a equipe de TI/administração para solicitar um aumento.
Eles não perderão o trabalho em andamento—Claude completará o turno atual antes de limitar o uso adicional.