Claude Enterprise proporciona a tu organización acceso a IA potente en chat, Claude Code y Claude Cowork. Con ese acceso viene la responsabilidad de gestionar el consumo de manera efectiva—asegurando que tu equipo obtenga el máximo valor mientras mantienes el uso predecible y dentro del presupuesto.
Esta guía acompaña a los administradores de Enterprise a través de los controles clave disponibles para controlar y optimizar el consumo de tokens: establecer límites de gasto, configurar controles de acceso basados en roles, educar a los usuarios y elegir el modelo correcto para la tarea correcta.
Por qué importa la gestión del consumo
Claude Enterprise se factura con un modelo por puesto y basado en el uso. El grupo de consumo de tu organización se comparte entre todos los usuarios, y algunas superficies—particularmente Claude Code y Cowork—consumen tokens a una velocidad significativamente mayor que el chat estándar.
Los administradores que configuran proactivamente límites de gasto y educan a los usuarios pueden reducir el desperdicio y asegurar que los casos de uso de alto valor obtengan la capacidad que necesitan.
Comprender la intensidad de tokens en todas las superficies
Superficie | Intensidad de tokens y qué la impulsa |
Chat principal | Intensidad más baja. Conversación estándar de ida y vuelta, resumen, redacción y preguntas y respuestas. El uso de tokens se escala con la longitud del mensaje y el historial de conversación. |
Claude Code | Intensidad más alta. Cada sesión de codificación incluye indicaciones del sistema, contexto de archivos, llamadas de herramientas y razonamiento de múltiples turnos—más tokens por sesión que en chat. |
Claude Cowork | Intensidad más alta. Los flujos de trabajo agénticos, la ejecución de tareas de múltiples pasos y las habilidades generan un uso significativo de tokens intermedios que puede no ser visible para los usuarios finales. |
Consejo de administrador: Establece expectativas con tu equipo
Los usuarios que ejecutan flujos de trabajo de Claude Code o Cowork pueden no darse cuenta de cuán intensivos en tokens son sus sesiones. Una única tarea de Cowork o una sesión de depuración de Claude Code puede consumir muchos más tokens que el chat. Incluye este contexto en cualquier incorporación de usuarios que envíes.
Controles de acceso basados en roles
Los controles de acceso basados en roles (RBAC) te permiten agrupar usuarios y gestionar su acceso a las superficies de Claude y presupuestos de consumo como una unidad en lugar de individuo por individuo. Esta es la forma más escalable de gobernar el uso en organizaciones más grandes.
Cómo estructurar grupos
Piensa en los grupos en términos de función laboral y caso de uso, no de jerarquía organizativa. Algunos principios:
Crea grupos que se asignen a patrones de uso distintos, no a casillas del organigrama. "Ingeniería" y "Ventas" son más útiles que "América del Norte" y "EMEA" para la gestión del consumo.
Limita la proliferación de grupos. Más de 8–10 grupos se vuelve difícil de gestionar. Comienza con 4–6 y divide solo si los patrones de uso claramente divergen.
Usa grupos para controlar el acceso a superficies de alta intensidad. Por ejemplo: solo los miembros del grupo "Ingeniería" pueden acceder a Claude Code; otros usuarios ven solo Chat y Cowork.
Asigna límites de gasto a nivel de grupo como punto de partida, luego anula a nivel de usuario para casos atípicos (por ejemplo, un PM no técnico que necesita Claude Code para un proyecto específico).
Gestión del gasto del grupo
Una vez que los grupos estén configurados:
Revisa el consumo del grupo semanalmente durante el lanzamiento inicial, mensualmente después.
Cuando un grupo se acerca consistentemente a su límite, investiga antes de aumentarlo automáticamente—la respuesta correcta podría ser orientación de modelo (usa Sonnet en lugar de Opus) en lugar de más presupuesto.
Considera asignar un "propietario del grupo" en cada departamento que sea responsable de revisar el uso y responder preguntas de su equipo. Esto distribuye la carga de administración y pone a alguien con contexto empresarial en el circuito. Tenga en cuenta que esto implicaría proporcionar a estos individuos derechos de administrador, lo que puede no ser deseado.
Consejo de gobernanza: Superficie el acceso como primera puerta
Antes de preocuparte por los límites a nivel de token, asegúrate de que las personas correctas tengan acceso a las superficies correctas. Dar a todos acceso a Claude Code y Cowork el primer día es la forma más rápida de generar consumo inesperado. Lanza superficies de mayor intensidad en oleadas, comenzando con los equipos más probables de usarlas productivamente.
Establecer límites de gasto
Los límites de gasto son tu herramienta principal para controlar el consumo. Claude Enterprise permite a los administradores establecer límites en tres niveles: el nivel de la organización, el nivel del grupo (con RBAC) y el nivel del usuario individual. Nuestro enfoque recomendado es comenzar con límites a nivel de grupo RBAC y límites por usuario—estos te dan control preciso y dirigido sin el riesgo de cortar toda tu organización si se alcanza un límite.
Límites de gasto a nivel de organización
El límite a nivel de organización está disponible como un techo duro en todos los usuarios y superficies, pero úsalo con cuidado: alcanzarlo afecta a todos simultáneamente, lo que puede ser disruptivo. La mayoría de los administradores encuentran que gestionar el consumo a nivel de grupo y usuario les da mejores resultados con menos riesgo operativo.
Límite de gasto del grupo
Los límites de gasto del grupo te permiten asignar un límite de gasto mensual por usuario a un grupo completo, por lo que cada miembro de ese grupo hereda el mismo límite sin configurarlo individualmente. Esta es la forma más escalable de gestionar el consumo en organizaciones medianas a grandes, y es donde los administradores deben comenzar.
Ten en cuenta las siguientes reglas de precedencia:
Los límites individuales siempre anulan los límites del grupo, independientemente de cuál sea mayor.
Si un usuario pertenece a múltiples grupos con diferentes límites, la organización puede aplicar el límite de gasto más bajo o más alto. Usa el menú desplegable en "Valores predeterminados de gasto" para determinar la precedencia que deseas aplicar. Ten en cuenta que el límite predeterminado del tipo de puesto también se incluye en esta comparación.
Los límites en toda la organización siguen siendo el techo duro.
Sin límite en ningún lugar = sin límite. Si un miembro no tiene límite individual y ninguno de sus grupos tiene un límite, su gasto no está limitado.
Cómo configurar: Configuración de la organización > Uso > Por grupo. Establece límites a una cantidad específica en dólares o "Sin límite".
Límites de gasto a nivel de usuario
Los límites a nivel de usuario te permiten establecer límites de consumo para cuentas individuales. Estos son esenciales para organizaciones donde el uso varía significativamente entre roles—un desarrollador que usa Claude Code diariamente tiene necesidades muy diferentes a las de un comerciante que usa chat para redacción publicitaria.
Mejores prácticas para límites a nivel de usuario:
Define niveles de consumo basados en el tipo de rol antes del lanzamiento. Una estructura escalonada—por ejemplo, ligero, estándar, potencia—facilita la asignación y ajuste consistente de límites.
Comienza de manera conservadora. Es más fácil aumentar un límite basado en la solicitud de un usuario que retroceder en una conversación de sobrecargo.
Otorga a los usuarios avanzados (ingenieros, científicos de datos, investigadores) límites individuales más altos o sin límite, pero compénsalo asegurándote de que utilicen el modelo Claude correcto para cada tarea.
Revisa los informes de uso individual mensualmente para identificar valores atípicos: usuarios que constantemente alcanzan su límite (pueden necesitar más) y usuarios que consumen muy poco (es posible que aún no estén activados).
Puntos de partida recomendados
Tipo de usuario | Código | Cowork | Chat |
Avanzado (Top 10%) | $200 | $100 | $50 |
Típico (Media) | $85 | $50 | $20 |
Ligero (Mediana) | $25 | $20 | $5 |
*Estas cifras son estimaciones aproximadas de planificación. El consumo real variará según el tamaño de tu equipo, flujos de trabajo y patrones de uso.
Orientación sobre selección de modelos
Una de las cosas más impactantes que un administrador puede hacer es proporcionar orientación clara a los usuarios sobre qué modelo usar para qué tareas. La elección del modelo tiene un impacto directo y significativo en el consumo de tokens: Opus puede consumir varias veces más tokens que Sonnet para la misma tarea.
El modelo correcto para la tarea correcta
Modelo | Mejor para | Intensidad de tokens | Uso recomendado |
Claude Sonnet | Tareas cotidianas, escritura, análisis, preguntas y respuestas | Moderada | Modelo predeterminado para todos los usuarios: establécelo como predeterminado en toda la organización |
Claude Opus | Razonamiento complejo, investigación, tareas multietapa | Alta | Reserva solo para usuarios avanzados o flujos de trabajo específicos |
Claude Haiku | Búsquedas simples, resúmenes, respuestas rápidas | Baja | Tareas de automatización de alto volumen y bajo peso |
Recomendaciones de configuración del administrador
Si tienes flujos de trabajo de alto volumen y baja complejidad (por ejemplo, resumir tickets de soporte, generar borradores de correos electrónicos), evalúa si Haiku es una mejor opción: puede reducir significativamente el consumo en estos casos de uso.
Audita periódicamente qué modelos están seleccionando realmente tus usuarios. Si la mayoría de tu consumo es en Opus, eso es una señal de que tu orientación sobre modelos no está llegando.
Qué decirles a tus usuarios sobre la elección de modelo
Sonnet es tu herramienta diaria. Es rápido, muy capaz y está diseñado para la gran mayoría de tareas: escritura, análisis, ayuda con codificación y preguntas y respuestas.
Opus es para el trabajo más difícil y complejo. Úsalo cuando estés trabajando en un problema multietapa genuinamente complejo, o cuando la calidad importa más que la velocidad.
En caso de duda, comienza con Sonnet. Siempre puedes cambiar el modelo a mitad de la conversación a Opus si necesitas más profundidad.
Usar preferencias de organización para moldear el comportamiento del usuario
Las Preferencias de Organización permiten a los administradores inyectar orientación permanente en cada conversación de Claude en toda tu organización, proporcionando efectivamente a Claude un aviso del sistema que refleja las normas, mejores prácticas y salvaguardas de tu equipo. Esta es una herramienta de alto impacto para cambiar el comportamiento del usuario sin agregar fricción, porque la orientación aparece en el producto en el momento de uso en lugar de en documentación que los usuarios tienen que buscar.
Algunas formas en que puedes usar Preferencias de Organización para gestionar el consumo y los patrones de uso:
Desalienta formatos de salida intensivos en tokens. Si has notado la proliferación de un tipo de artefacto particular (por ejemplo, paneles HTML que se comparten en hilos multifuncionales donde un formato más simple sería suficiente), puedes instruir a Claude para que confirme con el usuario antes de generar uno. Esto agrega una verificación ligera sin eliminar completamente la capacidad.
Dirige a los usuarios a recursos internos. Haz referencia a la wiki de tu equipo, documentos de mejores prácticas o guías de uso directamente en la preferencia. Claude los mostrará cuando sea relevante, dirigiendo a los usuarios hacia el contexto interno correcto en lugar de reinventarlo cada vez.
Refuerza las normas de selección de modelo. Recuerda a Claude (y por extensión, a los usuarios) que Sonnet es el predeterminado y Opus está reservado para flujos de trabajo específicos. Esto complementa la educación del usuario sin requerir que todos lo interioricen de antemano.
Seguimiento de uso y gasto
Página de Analytics
La página de Analytics dentro del menú de usuario (claude.ai/analytics) es la forma más rápida de obtener una lectura de tu organización. Muestra usuarios activos semanales, utilización de asientos, conectores principales, gasto total (MTD/QTD/YTD), gasto por modelo y un ranking de los 10 principales usuarios por gasto. Las vistas específicas del producto para Claude.ai, Claude Code y Cowork desglosan la actividad de cada superficie. Más información.
Exportación de informe de gasto en CSV
Si necesitas un desglose detallado puntual, puedes exportar un informe de gasto por usuario y por modelo como CSV desde Analytics > All Activity > Spend > Export Spend. Elige MTD, mes pasado, últimos 90 días o un rango personalizado de hasta 90 días atrás. El CSV incluye correo electrónico del usuario, ID de usuario, UUID de cuenta, producto, modelo, recuento de solicitudes, tokens de indicación y finalización, y gasto neto y bruto en USD.
Chat de Analytics
Analytics chat te permite hacer preguntas sobre el uso de tu organización en lenguaje natural. Escribe una pregunta—"muéstrame el gasto diario de los últimos 30 días", "quiénes son nuestros principales gastadores", "cuál es nuestra tasa de utilización de asientos"—y Claude devuelve un gráfico y un breve resumen escrito de lo que encontró. Puedes hacer seguimiento para refinar, profundizar o cambiar de dirección sin empezar de nuevo.
Usa esto cuando tengas una pregunta específica y no quieras navegar por el panel, o cuando estés explorando tendencias y quieras una interacción rápida. Los resultados cubren los últimos 30 días por defecto; especifica un rango diferente en tu pregunta si lo necesitas. Los datos se actualizan diariamente. Más información.
API de Analytics
Para acceso programático, utiliza la API de Analytics de Claude Enterprise. Extrae una lista clasificada de usuarios por tokens utilizados o dólares gastados, o examina tendencias de uso y costo a lo largo del tiempo desglosadas por producto, modelo, ventana de contexto o región. Cada solicitud está limitada a 31 días de ancho, comenzando dentro de los últimos 365 días, y no antes del 1 de enero de 2026.
Tu Propietario Principal puede generar una clave de API de administrador. Los datos se actualizan cada cuatro horas; para totales de calidad de facturación, consulta fechas de 30 o más días en el pasado para que los eventos tardíos tengan tiempo de reconciliarse. Más información y revisa la guía de referencia de API.
Educación del usuario final
Los controles tecnológicos te llevarán la mayor parte del camino, pero el comportamiento del usuario impulsa el resto. Un equipo que entienda cómo funciona el consumo tomará mejores decisiones de forma independiente y te presentará menos casos extremos para solucionar.
Qué comunicar a los usuarios finales
Cuando incorpores usuarios, comparte lo siguiente:
Cómo se factura Claude
El uso se mide en tokens. Los indicadores largos y las conversaciones largas consumen más tokens.
Las sesiones de Claude Code y Cowork consumen significativamente más tokens que el chat. Una única sesión de codificación larga puede usar muchos más tokens que una sesión de chat típica.
Verifica tu uso en configuración alternando a Settings → Usage.
Cómo elegir un modelo
Sonnet es el predeterminado y maneja bien la mayoría de las tareas. Usa Opus solo cuando Sonnet no te lleve a donde necesitas ir.
El selector de modelo es visible en la interfaz—recuerda a los usuarios que lo verifiquen, especialmente si están ejecutando tareas complejas.
El selector de modelo es persistente, ¡así que haz una práctica verificar que sea el modelo que quieres usar!
Qué sucede cuando alcanzan un límite
Si un usuario alcanza su límite individual, puede contactar al propietario de su grupo o al equipo de TI/administración para solicitar un aumento.
No perderán el trabajo en progreso—Claude completará el turno actual antes de limitar el uso adicional.
