Ir para conteúdo principal

Guia de consumo do Claude Enterprise

Claude Enterprise oferece à sua organização acesso a IA poderosa em chat, Claude Code e Claude Cowork. Com esse acesso vem a responsabilidade de gerenciar o consumo de forma eficaz—garantindo que sua equipe obtenha o máximo valor mantendo o uso previsível e dentro do orçamento.

Este guia orienta administradores Enterprise através dos principais controles disponíveis para gerenciar e otimizar o consumo de tokens: definir limites de gastos, configurar controles de acesso baseados em funções, educar usuários e escolher o modelo certo para a tarefa certa.


Por que o gerenciamento de consumo é importante

Claude Enterprise é precificado em um modelo por assento com base em uso. O pool de consumo da sua organização é compartilhado entre todos os usuários, e algumas superfícies—particularmente Claude Code e Cowork—consomem tokens a uma taxa significativamente mais alta do que o chat padrão.

Administradores que configurarem proativamente limites de gastos e educarem usuários podem reduzir desperdícios e garantir que casos de uso de alto valor obtenham a capacidade necessária.


Compreendendo a intensidade de tokens entre superfícies

Superfície

Intensidade de tokens e o que a impulsiona

Chat Principal

Intensidade mais baixa. Conversa padrão de ida e volta, resumo, redação e P&A. O uso de tokens escala com o comprimento da mensagem e histórico de conversa.

Claude Code

Intensidade mais alta. Cada sessão de codificação inclui prompts do sistema, contexto de arquivo, chamadas de ferramentas e raciocínio multi-turno—mais tokens por sessão do que chat.

Claude Cowork

Intensidade mais alta. Fluxos de trabalho agênticos, execução de tarefas em várias etapas e Skills geram uso significativo de tokens intermediários que podem não ser visíveis aos usuários finais.

Dica do administrador: Defina expectativas com sua equipe

Usuários executando fluxos de trabalho Claude Code ou Cowork podem não perceber o quão intensivo em tokens suas sessões são. Uma única tarefa Cowork ou sessão de depuração Claude Code pode consumir muito mais tokens do que chat. Inclua esse contexto em qualquer integração de usuário que você enviar.


Controles de acesso baseados em funções

Controles de acesso baseados em funções (RBAC) permitem agrupar usuários e gerenciar seu acesso às superfícies Claude e orçamentos de consumo como uma unidade em vez de individualmente. Esta é a forma mais escalável de governar o uso em organizações maiores.

Como estruturar grupos

Pense em grupos em termos de função de trabalho e caso de uso, não hierarquia organizacional. Alguns princípios:

  • Crie grupos que mapeiem padrões de uso distintos, não caixas de organograma. "Engenharia" e "Vendas" são mais úteis do que "América do Norte" e "EMEA" para gerenciamento de consumo.

  • Limite a proliferação de grupos. Mais de 8–10 grupos fica difícil de gerenciar. Comece com 4–6 e divida apenas se os padrões de uso divergirem claramente.

  • Use grupos para controlar o acesso a superfícies de alta intensidade. Por exemplo: apenas membros do grupo "Engenharia" podem acessar Claude Code; outros usuários veem apenas Chat e Cowork.

  • Atribua limites de gastos no nível do grupo como ponto de partida, depois substitua no nível do usuário para exceções (por exemplo, um PM não técnico que precisa de Claude Code para um projeto específico).

Gerenciamento de gastos do grupo

Depois que os grupos são configurados:

  • Revise o consumo do grupo semanalmente durante o lançamento inicial, mensalmente depois.

  • Quando um grupo se aproxima consistentemente de seu limite, investigue antes de aumentá-lo automaticamente—a resposta correta pode ser orientação de modelo (use Sonnet em vez de Opus) em vez de mais orçamento.

  • Considere atribuir um "proprietário do grupo" em cada departamento responsável por revisar o uso e responder perguntas de sua equipe. Isso distribui a carga administrativa e coloca alguém com contexto comercial no processo. Observe que isso envolveria fornecer a esses indivíduos direitos de administrador, o que pode não ser desejado.

Dica de governança: Superfície de acesso como primeiro portão

Antes de se preocupar com limites no nível de tokens, certifique-se de que as pessoas certas têm acesso às superfícies certas. Dar a todos acesso a Claude Code e Cowork no primeiro dia é a forma mais rápida de gerar consumo inesperado. Implante superfícies de maior intensidade em ondas, começando com as equipes mais propensas a usá-las produtivamente.


Defina limites de gastos

Limites de gastos são sua ferramenta principal para controlar o consumo. Claude Enterprise permite que administradores definam limites em três níveis: nível organizacional, nível de grupo (com RBAC) e nível de usuário individual. Nossa abordagem recomendada é começar com limites no nível de grupo RBAC e limites por usuário—estes lhe dão controle preciso e direcionado sem o risco de cortar toda a sua organização se um limite for atingido.

Limites de gastos no nível organizacional

O limite no nível organizacional está disponível como um teto rígido em todos os usuários e superfícies, mas use-o com cuidado: atingi-lo afeta todos simultaneamente, o que pode ser disruptivo. A maioria dos administradores acha que gerenciar o consumo no nível de grupo e usuário oferece melhores resultados com menos risco operacional.

Limite de gastos do grupo

Limites de gastos do grupo permitem atribuir um limite de gastos mensal por usuário a um grupo inteiro, para que cada membro do grupo herde o mesmo limite sem configurá-lo individualmente. Esta é a forma mais escalável de gerenciar o consumo em organizações médias a grandes, e é onde os administradores devem começar.

Observe as seguintes regras de precedência:

  • Limites individuais sempre substituem limites de grupo, independentemente de qual seja maior.

  • Se um usuário pertence a vários grupos com limites diferentes, a organização pode aplicar o limite de gastos mais baixo ou mais alto. Use o menu suspenso em "Padrões de gastos" para determinar a precedência que deseja aplicar. Observe que o limite padrão do tipo de assento também está incluído nesta comparação.

  • Limites em toda a organização permanecem o teto rígido.

  • Sem limite em lugar nenhum = sem limite. Se um membro não tiver limite individual e nenhum de seus grupos tiver limite, seu gasto não será limitado.

Como configurar: Configurações da organização > Uso > Por grupo. Defina limites para um valor em dólar específico ou "Ilimitado".

Limites de gastos no nível do usuário

Limites no nível do usuário permitem definir limites de consumo para contas individuais. Estes são essenciais para organizações onde o uso varia significativamente entre funções—um desenvolvedor usando Claude Code diariamente tem necessidades muito diferentes de um profissional de marketing usando chat para redação.

Melhores práticas para limites no nível do usuário:

  • Defina camadas de consumo com base no tipo de função antes do lançamento. Uma estrutura em camadas—por exemplo, leve, padrão, potência—facilita a atribuição e ajuste de limites consistentemente.

  • Comece conservadoramente. É mais fácil aumentar um limite com base na solicitação de um usuário do que reverter uma conversa de excesso.

  • Dê aos usuários avançados (engenheiros, cientistas de dados, pesquisadores) limites individuais mais altos ou ilimitados, mas compense isso garantindo que eles usem o modelo Claude correto para a tarefa correta.

  • Monitore relatórios de uso individual mensalmente para identificar outliers—tanto usuários que consistentemente atingem seu limite (podem precisar de mais) quanto usuários consumindo muito pouco (podem ainda não estar ativados).

Pontos de partida recomendados

Tipo de usuário

Código

Cowork

Chat

Avançado (Top 10%)

$200

$100

$50

Típico (Média)

$85

$50

$20

Leve (Mediana)

$25

$20

$5

*Estes valores são estimativas aproximadas de planejamento. O consumo real variará com base no tamanho da sua equipe, fluxos de trabalho e padrões de uso.


Orientação de seleção de modelo

Uma das coisas mais impactantes que um administrador pode fazer é estabelecer orientação clara para os usuários sobre qual modelo usar para quais tarefas. A escolha do modelo tem um impacto direto e significativo no consumo de tokens—Opus pode consumir várias vezes mais tokens que Sonnet para a mesma tarefa.

O modelo certo para a tarefa certa

Modelo

Melhor para

Intensidade de tokens

Uso recomendado

Claude Sonnet

Tarefas cotidianas, redação, análise, perguntas e respostas

Moderada

Modelo padrão para todos os usuários—defina como padrão em toda a organização

Claude Opus

Raciocínio complexo, pesquisa, tarefas com múltiplas etapas

Alta

Reserve para usuários avançados ou fluxos de trabalho específicos apenas

Claude Haiku

Buscas simples, resumos, respostas rápidas

Baixa

Tarefas de automação de alto volume e baixa complexidade

Recomendações de configuração do administrador

  • Se você tem fluxos de trabalho de alto volume e baixa complexidade (por exemplo, resumir tickets de suporte, gerar rascunhos de e-mails), avalie se Haiku é uma opção melhor—pode reduzir significativamente o consumo nesses casos de uso.

  • Audite periodicamente quais modelos seus usuários estão realmente selecionando. Se a maioria do seu consumo é em Opus, isso é um sinal de que sua orientação de modelo não está funcionando.

O que dizer aos seus usuários sobre a escolha de modelo

Sonnet é seu modelo principal. É rápido, altamente capaz e foi projetado para a grande maioria das tarefas—redação, análise, ajuda com codificação e perguntas e respostas.

Opus é para o trabalho mais difícil e complexo. Use-o quando estiver trabalhando em um problema genuinamente complexo com múltiplas etapas, ou quando a qualidade importa mais que a velocidade.

Em caso de dúvida, comece com Sonnet. Você sempre pode mudar o modelo no meio da conversa para Opus se precisar de mais profundidade.


Usando preferências da organização para moldar o comportamento do usuário

As Preferências da Organização permitem que administradores injetem orientação permanente em todas as conversas do Claude em sua organização—efetivamente dando ao Claude um prompt de sistema que reflete as normas, melhores práticas e diretrizes da sua equipe. Esta é uma ferramenta de alto impacto para mudar o comportamento do usuário sem adicionar atrito, porque a orientação aparece no produto no momento do uso em vez de em documentação que os usuários precisam procurar.

Algumas maneiras pelas quais você pode usar as Preferências da Organização para gerenciar o consumo e os padrões de uso:

  • Desestimule formatos de saída intensivos em tokens. Se você notou proliferação de um tipo de artefato específico (por exemplo, dashboards HTML sendo compartilhados em threads multifuncionais onde um formato mais simples seria suficiente), você pode instruir o Claude a confirmar com o usuário antes de gerar um. Isso adiciona uma verificação leve sem remover a capacidade completamente.

  • Direcione os usuários para recursos internos. Faça referência ao wiki da sua equipe, documentos de melhores práticas ou diretrizes de uso diretamente na preferência. Claude os exibirá quando relevante—direcionando os usuários para o contexto interno correto em vez de reinventar a cada vez.

  • Reforce as normas de seleção de modelo. Lembre Claude (e, por extensão, os usuários) que Sonnet é o padrão e Opus é reservado para fluxos de trabalho específicos. Isso complementa a educação do usuário sem exigir que todos internalizem isso de antemão.


Rastreamento de uso e gastos

Página de análises

A página de análises no menu do usuário (claude.ai/analytics) é a forma mais rápida de avaliar sua organização. Ela mostra usuários ativos semanalmente, utilização de assentos, conectores principais, gastos totais (MTD/QTD/YTD), gastos por modelo e um ranking dos 10 principais usuários por gastos. Visualizações específicas do produto para Claude.ai, Claude Code e Cowork detalham a atividade de cada superfície. Saiba mais.

Exportação de relatório de gastos em CSV

Se você precisar de um detalhamento detalhado único, pode exportar um relatório de gastos por usuário e por modelo como CSV em Analytics > All Activity > Spend > Export Spend. Escolha MTD, mês passado, últimos 90 dias ou um intervalo personalizado de até 90 dias atrás. O CSV inclui email do usuário, ID do usuário, UUID da conta, produto, modelo, contagem de solicitações, tokens de prompt e conclusão, e gastos líquidos e brutos em USD.

Chat de análises

O chat de análises permite que você faça perguntas sobre o uso da sua organização em linguagem natural. Digite uma pergunta—"mostre-me os gastos diários dos últimos 30 dias", "quem são nossos maiores gastadores", "qual é nossa taxa de utilização de assentos"—e Claude retorna um gráfico e um breve resumo escrito do que encontrou. Você pode fazer acompanhamentos para refinar, aprofundar ou mudar de direção sem começar do zero.

Use isso quando você tiver uma pergunta específica e não quiser navegar no painel, ou quando estiver explorando tendências e quiser uma troca rápida. Os resultados cobrem os últimos 30 dias por padrão; especifique um intervalo diferente em sua pergunta se precisar. Os dados são atualizados diariamente. Saiba mais.

API de análises

Para acesso programático, use a API de análises do Claude Enterprise. Extraia uma lista classificada de usuários por tokens usados ou dólares gastos, ou observe tendências de uso e custo ao longo do tempo divididas por produto, modelo, janela de contexto ou região. Cada solicitação é limitada a 31 dias de largura, começando nos últimos 365 dias, e não antes de 1º de janeiro de 2026.

Seu Proprietário Primário pode gerar uma chave de API de administrador. Os dados são atualizados a cada quatro horas; para totais em nível de faturamento, consulte datas 30+ dias no passado para que eventos tardios tenham tempo para reconciliação. Saiba mais e revise o guia de referência da API.


Educação do usuário final

Os controles tecnológicos o levarão a maior parte do caminho, mas o comportamento do usuário impulsiona o resto. Uma equipe que entende como funciona o consumo fará melhores escolhas independentemente—e apresentará menos casos extremos para você solucionar.

O que comunicar aos usuários finais

Ao integrar usuários, compartilhe o seguinte:

Como Claude é cobrado

  • O uso é medido em tokens. Prompts longos e conversas longas consomem mais tokens.

  • As sessões de Claude Code e Cowork consomem significativamente mais tokens do que o chat. Uma única sessão de codificação longa pode usar muito mais tokens do que uma sessão de chat típica.

  • Verifique seu uso nas configurações alternando para Settings → Usage.

Como escolher um modelo

  • Sonnet é o padrão e lida bem com a maioria das tarefas. Use Opus apenas quando Sonnet não o levar aonde você precisa ir.

  • O seletor de modelo é visível na interface—lembre os usuários de verificá-lo, especialmente se estiverem executando tarefas complexas.

  • O seletor de modelo é fixo, então faça uma prática de verificar se é o modelo que você deseja usar!

O que acontece quando eles atingem um limite

  • Se um usuário atingir seu limite individual, ele pode entrar em contato com o proprietário do grupo ou com a equipe de TI/administração para solicitar um aumento.

  • Eles não perderão o trabalho em andamento—Claude completará o turno atual antes de limitar o uso adicional.

Isto respondeu à sua pergunta?