Guía de consumo de Claude Enterprise | Centro de ayuda de Anthropic

Claude Enterprise proporciona a tu organización acceso a IA potente en chat, Claude Code y Claude Cowork. Con ese acceso viene la responsabilidad de gestionar el consumo de manera efectiva, asegurando que tu equipo obtenga el máximo valor mientras mantienes el uso predecible y dentro del presupuesto.

Esta guía acompaña a los administradores de Enterprise a través de los controles clave disponibles para controlar y optimizar el consumo de tokens: establecer límites de gasto, configurar controles de acceso basados en roles, educar a los usuarios y elegir el modelo y nivel de esfuerzo adecuados para cada tarea.

Por qué importa la gestión del consumo

Claude Enterprise se factura con un modelo por asiento y basado en el uso. El fondo de consumo de tu organización se comparte entre todos los usuarios, y algunas superficies—particularmente Claude Code y Cowork—consumen tokens a una velocidad significativamente mayor que el chat estándar.

Los administradores que configuran proactivamente límites de gasto y educan a los usuarios pueden reducir el desperdicio y asegurar que los casos de uso de alto valor obtengan la capacidad que necesitan.

Comprender la intensidad de tokens en diferentes superficies

Superficie	Intensidad de tokens y qué la impulsa
Chat principal	Intensidad baja. Conversación estándar de ida y vuelta, resumen, redacción y preguntas y respuestas. El uso de tokens se escala con la longitud del mensaje y el historial de conversación.
Claude Code	Intensidad alta. Cada sesión de codificación incluye indicaciones del sistema, contexto de archivos, llamadas de herramientas y razonamiento multiturn—más tokens por sesión que en chat.
Claude Cowork	Intensidad alta. Los flujos de trabajo agénticos, la ejecución de tareas multietapa y las Skills generan un uso significativo de tokens intermedios que puede no ser visible para los usuarios finales.

Consejo de administrador: Establece expectativas con tu equipo

Los usuarios que ejecutan flujos de trabajo de Claude Code o Cowork pueden no darse cuenta de cuán intensivos en tokens son sus sesiones. Una única tarea de Cowork o una sesión de depuración de Claude Code puede consumir muchos más tokens que el chat. Incluye este contexto en cualquier incorporación de usuarios que envíes.

Controles de acceso basados en roles

Los controles de acceso basados en roles (RBAC) te permiten agrupar usuarios y gestionar su acceso a las superficies de Claude y presupuestos de consumo como una unidad en lugar de individuo por individuo. Esta es la forma más escalable de gobernar el uso en organizaciones más grandes.

Cómo estructurar grupos

Piensa en los grupos en términos de función laboral y caso de uso, no de jerarquía organizativa. Algunos principios:

Crea grupos que se asignen a patrones de uso distintos, no a casillas del organigrama. "Ingeniería" y "Ventas" son más útiles que "América del Norte" y "EMEA" para la gestión del consumo.
Limita la proliferación de grupos. Más de 8–10 grupos se vuelve difícil de gestionar. Comienza con 4–6 y divide solo si los patrones de uso claramente divergen.
Usa grupos para controlar el acceso a superficies de alta intensidad. Por ejemplo: solo los miembros del grupo "Ingeniería" pueden acceder a Claude Code; otros usuarios ven solo Chat y Cowork.
Asigna límites de gasto a nivel de grupo como punto de partida, luego anula a nivel de usuario para casos atípicos (por ejemplo, un PM no técnico que necesita Claude Code para un proyecto específico).

Gestión del gasto del grupo

Una vez que los grupos estén configurados:

Revisa el consumo del grupo semanalmente durante el lanzamiento inicial, mensualmente después.
Cuando un grupo se acerca consistentemente a su límite, investiga antes de aumentarlo automáticamente—la respuesta correcta podría ser orientación de modelo (usa Sonnet en lugar de Opus) en lugar de más presupuesto.
Considera asignar un "propietario del grupo" en cada departamento que sea responsable de revisar el uso y responder preguntas de su equipo. Esto distribuye la carga de administración y pone a alguien con contexto empresarial en el circuito. Ten en cuenta que esto implicaría proporcionar a estos individuos derechos de administrador, lo que puede no ser deseado.

Consejo de gobernanza: Usa el acceso a superficies como primera puerta

Antes de preocuparte por límites a nivel de tokens, asegúrate de que las personas correctas tengan acceso a las superficies correctas. Dar a todos acceso a Claude Code y Cowork el primer día es la forma más rápida de generar consumo inesperado. Implementa superficies de mayor intensidad en oleadas, comenzando con los equipos más propensos a usarlas productivamente.

Establece límites de gasto

Los límites de gasto son tu herramienta principal para controlar el consumo. Claude Enterprise permite a los administradores establecer límites en tres niveles: el nivel de organización, el nivel de grupo (con RBAC) y el nivel de usuario individual. Nuestro enfoque recomendado es comenzar con límites a nivel de grupo RBAC y límites por usuario—estos te dan control preciso y dirigido sin el riesgo de cortar toda tu organización si se alcanza un límite.

Límites de gasto a nivel de organización

El límite a nivel de organización está disponible como un techo duro en todos los usuarios y superficies, pero úsalo con cuidado: alcanzarlo afecta a todos simultáneamente, lo que puede ser disruptivo. La mayoría de los administradores encuentran que gestionar el consumo a nivel de grupo y usuario les da mejores resultados con menos riesgo operativo.

Límite de gasto del grupo

Los límites de gasto del grupo te permiten asignar un límite de gasto mensual por usuario a un grupo completo, de modo que cada miembro del grupo hereda el mismo límite sin configurarlo individualmente. Esta es la forma más escalable de gestionar el consumo en organizaciones medianas a grandes, y es donde los administradores deben comenzar.

Ten en cuenta las siguientes reglas de precedencia:

Los límites individuales siempre anulan los límites de grupo, independientemente de cuál sea mayor.
Si un usuario pertenece a múltiples grupos con diferentes límites, la configuración Límite de gasto de múltiples grupos bajo Valores predeterminados de gasto controla si se aplica el límite superior o inferior. El límite predeterminado del tipo de asiento se incluye en esta comparación.
Los límites en toda la organización siguen siendo el techo duro.
Sin límite en ningún lugar = sin límite. Si un miembro no tiene límite individual y ninguno de sus grupos tiene un límite, su gasto no está limitado.

Cómo configurar: Configuración de la organización → Uso → Por grupo. Establece límites a una cantidad específica en dólares o "Sin límite".

Límites de gasto a nivel de usuario

Los límites a nivel de usuario te permiten establecer límites de consumo para cuentas individuales. Estos son esenciales para organizaciones donde el uso varía significativamente entre roles—un desarrollador que usa Claude Code diariamente tiene necesidades muy diferentes a las de un especialista en marketing que usa chat para redacción publicitaria.

Mejores prácticas para límites a nivel de usuario:

Define niveles de consumo basados en el tipo de rol antes del lanzamiento. Una estructura escalonada—por ejemplo, ligero, estándar, potencia—facilita la asignación y ajuste consistente de límites.
Comienza de manera conservadora. Es más fácil aumentar un límite basado en la solicitud de un usuario que retractarse de una conversación de exceso.
Otorga a los usuarios avanzados (ingenieros, científicos de datos, investigadores) límites individuales más altos o sin límite, pero compénsalo asegurando que utilicen el modelo Claude correcto para cada tarea.
Revisa los informes de uso individual mensualmente para identificar valores atípicos: tanto usuarios que constantemente alcanzan su límite (pueden necesitar más) como usuarios que consumen muy poco (es posible que aún no estén activados).

Puntos de partida recomendados

Tipo de usuario	Código	Cowork	Chat
Avanzado (Top 10%)	$500	$100	$90
Típico (Media)	$215	$40	$30
Ligero (Mediana)	$40	$10	$5

*Estas cifras son estimaciones aproximadas de planificación. El consumo real variará según el tamaño de tu equipo, flujos de trabajo y patrones de uso.

Orientación sobre la selección de modelos

Una de las cosas más impactantes que un administrador puede hacer es establecer una orientación clara para los usuarios sobre qué modelo usar para qué tareas. La elección del modelo tiene un impacto directo y significativo en el consumo de tokens: Opus puede consumir varias veces más tokens que Sonnet para la misma tarea.

El nivel de esfuerzo es una segunda palanca de consumo. Los usuarios pueden elegir cuánto pensamiento aplica Claude a cada respuesta, y los niveles de esfuerzo más altos consumen más tokens que los más bajos. Anima a los usuarios a reservar el esfuerzo máximo solo para las tareas más exigentes y a usar un esfuerzo menor para tareas rutinarias.

El modelo correcto para la tarea correcta

Modelo	Mejor para	Intensidad de tokens	Uso recomendado
Claude Fable	Trabajo de codificación agéntica de días completos y tareas de razonamiento	Muy alta	Reserva para tu trabajo agéntico más valioso y complejo. Precios premium y consumo más rápido que Opus.
Claude Opus	Razonamiento complejo, investigación, tareas multietapa	Alta	Reserva solo para usuarios avanzados o flujos de trabajo específicos
Claude Sonnet	Tareas cotidianas, escritura, análisis, preguntas y respuestas	Moderada	Modelo predeterminado para todos los usuarios: establécelo como predeterminado en toda tu organización (ver más abajo)
Claude Haiku	Búsquedas simples, resúmenes, respuestas rápidas	Baja	Tareas de automatización ligera de alto volumen

Establece el modelo predeterminado de tu organización (beta)

Más allá de guiar a los usuarios hacia el modelo correcto, puedes establecer el modelo con el que comienzan las nuevas conversaciones para todos en tu organización. Esta es una de las palancas de consumo más directas disponibles: el predeterminado determina lo que la mayoría de los usuarios ejecutan día a día.

Tienes dos opciones:

Recomendado por Anthropic — se actualiza automáticamente cuando se lanzan nuevos modelos, por lo que tu organización siempre comienza con nuestro modelo de propósito general recomendado actualmente sin mantenimiento manual.
Elige el tuyo — establece un modelo específico como predeterminado de la organización y lo mantiene allí hasta que lo cambies. Úsalo cuando quieras estandarizar en un modelo conocido para previsibilidad de consumo (por ejemplo, usar Sonnet en lugar de Opus).

Esta configuración se aplica solo a chat y Cowork. Los valores predeterminados del modelo Claude Code se administran por separado a través de configuraciones administradas.

También puedes establecer valores predeterminados del modelo por rol a través de Roles personalizados, para que diferentes grupos puedan comenzar con diferentes modelos—por ejemplo, estableciendo tu grupo de ingeniería en un modelo y el resto de la organización en otro. Esto se combina naturalmente con los grupos RBAC que ya has configurado (consulta la Sección 2).

Cómo configurar: Configuración de la organización → Modelos.

Nota: La selección de modelo actual de los usuarios para nuevas conversaciones puede borrarse, por lo que adoptarán el valor predeterminado de la organización en su próxima conversación.

Gestiona el acceso a modelos de tu organización

Más allá de establecer un valor predeterminado, puedes restringir qué modelos están disponibles en absoluto—una palanca más firme que solo la orientación. Esto funciona en dos niveles:

Nivel de organización: cada modelo está habilitado o deshabilitado para todos, incluidos Propietarios y Administradores. Deshabilitar un modelo aquí lo elimina de cada selector en toda la organización.
Nivel de rol personalizado: para miembros en roles personalizados, cada rol otorga acceso a un subconjunto de lo que está habilitado a nivel de organización. Un rol no puede otorgar un modelo que la organización ha deshabilitado—la configuración de la organización siempre es el límite máximo.

Nota: Los modelos Haiku siempre están disponibles para cada miembro y no se pueden deshabilitar, por lo que siempre hay un modelo de respaldo.

Si un miembro pertenece a varios grupos con diferentes roles personalizados, el acceso es acumulativo—obtiene cada modelo que cualquiera de sus roles otorga (siempre que esté habilitado a nivel de organización).

Limitar el nivel de esfuerzo por rol

Más allá de restringir qué modelos puede usar un rol, puedes limitar el nivel de esfuerzo máximo que los miembros de ese rol pueden seleccionar por modelo—una versión más granular de la orientación de esfuerzo ya cubierta arriba. Esto solo se aplica a roles personalizados, no a nivel de organización. Si un miembro tiene varios roles, el límite de esfuerzo más alto entre esos roles gana.

Consejo de administrador: Combina restricciones de modelo + esfuerzo

Si la orientación de modelo (el mensaje "Sonnet es tu valor predeterminado") no está funcionando y aún ves un consumo pesado de Opus, restringir el acceso a Opus a roles específicos—o limitar el esfuerzo a Medio/Alto en lugar de Máximo para roles que no son de usuarios avanzados—es la siguiente palanca. Reserva acceso completo para los roles donde el razonamiento profundo realmente vale la pena.

Dónde se aplica esto

Las restricciones de acceso a modelos y esfuerzo se aplican en chat (web, escritorio, móvil), Claude Cowork, Office Agents y Claude Code (CLI 2.1.196+—las versiones anteriores aún muestran opciones restringidas pero las solicitudes que las usan se rechazan). Claude en Chrome, Claude Design y Claude Security aún no lo admiten.

Cómo configurar: Configuración de la organización → Roles → selecciona un rol → pestaña Modelos. Establece el acceso a modelos, un límite de esfuerzo opcional por modelo y un modelo predeterminado opcional a nivel de rol. Para gestionar la configuración en toda la organización, ve a Configuración de la organización → Modelos. Más detalles en Gestiona el acceso a modelos de tu organización.

Recomendaciones de configuración de administrador

Si tienes flujos de trabajo de alto volumen y baja complejidad (por ejemplo, resumir tickets de soporte, generar borradores de correos electrónicos), evalúa si Haiku es una mejor opción—puede reducir significativamente el consumo para estos casos de uso.
Audita periódicamente qué modelos están seleccionando realmente tus usuarios. Si la mayoría de tu consumo es en Opus, eso es una señal de que tu orientación de modelo no está funcionando.

Qué decirles a tus usuarios sobre la elección de modelo

Sonnet es tu herramienta diaria. Es rápido, muy capaz y está diseñado para la gran mayoría de tareas—escritura, análisis, ayuda con codificación y preguntas y respuestas.

Opus es para el trabajo más difícil y complejo. Úsalo cuando estés trabajando en un problema genuinamente complejo de múltiples pasos, o cuando la calidad importa más que la velocidad.

En caso de duda, comienza con Sonnet. Siempre puedes cambiar el modelo a mitad de la conversación a Opus si necesitas más profundidad.

Usar preferencias de organización para moldear el comportamiento del usuario

Las Preferencias de Organización permiten a los administradores inyectar orientación permanente en cada conversación de Claude en toda tu organización—efectivamente dándole a Claude un aviso del sistema que refleja las normas, mejores prácticas y salvaguardas de tu equipo. Esta es una herramienta de alto apalancamiento para cambiar el comportamiento del usuario sin agregar fricción, porque la orientación aparece en el producto en el momento de uso en lugar de en documentación que los usuarios tienen que buscar.

Algunas formas en que puedes usar Preferencias de Organización para gestionar el consumo y los patrones de uso:

Desalienta formatos de salida intensivos en tokens. Si has notado la proliferación de un tipo de artefacto particular (por ejemplo, paneles HTML que se comparten en hilos multifuncionales donde un formato más simple sería suficiente), puedes instruir a Claude para que confirme con el usuario antes de generar uno. Esto agrega una verificación ligera sin eliminar la capacidad por completo.
Dirige a los usuarios a recursos internos. Haz referencia a la wiki de tu equipo, documentos de mejores prácticas o directrices de uso directamente en la preferencia. Claude los mostrará cuando sea relevante—dirigiendo a los usuarios hacia el contexto interno correcto en lugar de reinventarlo cada vez.
Refuerza las normas de selección de modelo. Recuérdales a Claude (y por extensión, a los usuarios) que Sonnet es el valor predeterminado y Opus está reservado para flujos de trabajo específicos. Esto complementa la educación del usuario sin requerir que todos lo interioricen de antemano.

Seguimiento de uso y gasto

Página de Análisis

La página de Análisis dentro del menú de usuario (claude.ai/analytics) es la forma más rápida de obtener una lectura de tu organización. Muestra usuarios activos semanales, utilización de asientos, conectores principales, gasto total (MTD/QTD/YTD), gasto por modelo y un ranking de los 10 principales usuarios por gasto. Las vistas específicas del producto para Claude.ai, Claude Code y Cowork desglosan la actividad de cada superficie. Más información.

Exportación de informe de gasto en CSV

Si necesitas un desglose detallado único, puedes exportar un informe de gasto por usuario y por modelo como CSV desde Análisis → Toda la actividad → Gasto → Exportar gasto. Elige MTD, mes pasado, últimos 90 días o un rango personalizado hasta 90 días atrás. El CSV incluye correo electrónico del usuario, ID de usuario, UUID de cuenta, producto, modelo, recuento de solicitudes, tokens de aviso y finalización, y gasto neto y bruto en USD.

Chat de Análisis

El chat de Análisis te permite hacer preguntas sobre el uso de tu organización en lenguaje natural. Escribe una pregunta—"muéstrame el gasto diario de los últimos 30 días," "quiénes son nuestros principales gastadores," "cuál es nuestra tasa de utilización de asientos"—y Claude devuelve un gráfico y un breve resumen escrito de lo que encontró. Puedes hacer seguimiento para refinar, profundizar o cambiar de dirección sin empezar de nuevo.

Usa esto cuando tengas una pregunta específica y no quieras navegar por el panel, o cuando estés explorando tendencias y quieras una retroalimentación rápida. Los resultados cubren los últimos 30 días por defecto; especifica un rango diferente en tu pregunta si lo necesitas. Los datos se actualizan diariamente. Más información.

API de Análisis

Para acceso programático, usa la API de Análisis de Claude Enterprise. Extrae una lista clasificada de usuarios por tokens utilizados o dólares gastados, o mira tendencias de uso y costo a lo largo del tiempo desglosadas por producto, modelo, ventana de contexto o región. Cada solicitud está limitada a 31 días de ancho, comenzando dentro de los últimos 365 días, y no antes del 1 de enero de 2026.

Tu Propietario Principal puede generar una clave de API de administrador. Los datos se actualizan cada cuatro horas; para totales de calidad de facturación, consulta fechas 30+ días en el pasado para que los eventos tardíos tengan tiempo de reconciliarse. Más información y revisa la guía de referencia de API.

Educación del usuario final

Los controles tecnológicos te llevarán la mayor parte del camino, pero el comportamiento del usuario impulsa el resto. Un equipo que entiende cómo funciona el consumo tomará mejores decisiones de forma independiente—y te presentará menos casos extremos para solucionar.

Qué comunicar a los usuarios finales

Cuando incorpores usuarios, comparte lo siguiente:

Cómo se factura Claude

El uso se mide en tokens. Los avisos largos y las conversaciones largas consumen más tokens.
Las sesiones de Claude Code y Cowork consumen significativamente más tokens que el chat. Una única sesión de codificación larga puede usar muchos más tokens que una sesión de chat típica.
Verifica tu uso en configuración alternando a Configuración → Uso.

Cómo elegir un modelo

Sonnet es el valor predeterminado y maneja bien la mayoría de las tareas. Usa Opus solo cuando Sonnet no te lleve a donde necesitas ir.
Tu organización tiene un modelo predeterminado configurado para nuevas conversaciones; aún puedes cambiar de modelo durante la conversación cuando una tarea lo requiera.
El selector de modelo es visible en la interfaz—recuerda a los usuarios que lo verifiquen, especialmente si están ejecutando tareas complejas.
El selector de modelo es fijo, así que asegúrate de verificar que sea el modelo que deseas usar.
El nivel de esfuerzo aparece junto al nombre del modelo. Mayor esfuerzo significa respuestas más exhaustivas pero mayor consumo de tokens, así que ajústalo a la tarea.

Qué sucede cuando alcanzan un límite

Si un usuario alcanza su límite individual, puede contactar al propietario de su grupo o al equipo de TI/administración para solicitar un aumento.
No perderán el trabajo en progreso—Claude completará el turno actual antes de limitar el uso posterior.