跳转到主要内容

Claude Enterprise 消费指南

Claude Enterprise 为您的组织提供跨聊天、Claude Code 和 Claude Cowork 的强大 AI 访问权限。随之而来的是有效管理消费的责任——确保您的团队获得最大价值,同时保持使用可预测且在预算范围内。

本指南引导 Enterprise 管理员了解可用于控制和优化 token 消费的关键杠杆:设置支出上限、配置基于角色的访问控制、用户教育以及为正确的任务选择合适的模型。


为什么消费管理很重要

Claude Enterprise 采用按座位、基于使用量的定价模式。您组织的消费池在所有用户之间共享,某些界面——特别是 Claude Code 和 Cowork——的 token 消耗速率明显高于标准聊天。

主动配置支出限制并教育用户的管理员可以减少浪费,并确保高价值用例获得所需的容量。


了解不同界面的 token 强度

界面

Token 强度及其驱动因素

核心聊天

强度较低。标准的来回对话、摘要、起草和问答。Token 使用量随消息长度和对话历史而变化。

Claude Code

强度较高。每个编码会话包括系统提示、文件上下文、工具调用和多轮推理——每个会话的 token 数量比聊天多。

Claude Cowork

强度较高。代理工作流、多步骤任务执行和技能生成大量中间 token 使用,这些可能对最终用户不可见。

管理员提示:与您的团队设定期望

运行 Claude Code 或 Cowork 工作流的用户可能没有意识到他们的会话有多么耗费 token。单个 Cowork 任务或 Claude Code 调试会话可能消耗比聊天多得多的 token。在您发送的任何用户入职信息中包含此上下文。


基于角色的访问控制

基于角色的访问控制 (RBAC) 允许您对用户进行分组,并以单位而非逐个用户的方式管理他们对 Claude 界面和消费预算的访问权限。这是在大型组织中管理使用的最可扩展方式。

如何构建组

根据工作职能和用例而非组织层级来考虑组。以下是一些原则:

  • 创建映射到不同使用模式的组,而非组织结构图框。对于消费管理,"工程"和"销售"比"北美"和"欧中亚"更有用。

  • 限制组的增殖。超过 8-10 个组会变得难以管理。从 4-6 个开始,仅在使用模式明显不同时才进行拆分。

  • 使用组来限制对高强度界面的访问。例如:仅"工程"组的成员可以访问 Claude Code;其他用户只能看到聊天和 Cowork。

  • 将组级支出上限作为起点分配,然后在用户级别为异常值进行覆盖(例如,需要 Claude Code 进行特定项目的非技术产品经理)。

组支出管理

配置组后:

  • 在初始推出期间每周审查组消费,之后每月审查一次。

  • 当一个组持续接近其上限时,在自动提高之前进行调查——正确的响应可能是模型指导(使用 Sonnet 而非 Opus),而不是更多预算。

  • 考虑在每个部门分配一个"组所有者",负责审查使用情况并回答团队的问题。这分散了管理负担,并让具有业务背景的人参与其中。请注意,这需要为这些人员提供管理员权限,这可能不是所需的。

治理提示:将界面访问作为第一道关卡

在担心 token 级别的限制之前,请确保合适的人员可以访问合适的界面。在第一天就给所有人 Claude Code 和 Cowork 访问权限是生成意外消费的最快方式。分阶段推出高强度界面,从最可能有效使用它们的团队开始。


设置支出限制

支出限制是控制消费的主要工具。Claude Enterprise 允许管理员在三个级别设置限制:组织级别、组级别(使用 RBAC)和单个用户级别。我们推荐的方法是从 RBAC 组级别限制和按用户限制开始——这些提供精确、有针对性的控制,而不会因为达到限制而冒着切断整个组织的风险。

组织级支出限制

组织级限制可作为所有用户和界面的硬性上限,但要谨慎使用:达到它会同时影响所有人,这可能会造成中断。大多数管理员发现在组和用户级别管理消费能获得更好的结果,同时降低运营风险。

组支出限制

组支出限制允许您为整个组分配每用户每月支出限制,因此该组的每个成员都继承相同的限制,无需单独设置。这是在中大型组织中管理消费的最可扩展方式,也是管理员应该开始的地方。

请注意以下优先级规则:

  • 个人限制始终覆盖组限制,无论哪个更高。

  • 如果用户属于多个具有不同限制的组,组织可以应用最低或最高支出限制。使用"支出默认值"下的下拉菜单确定要应用的优先级。请注意,座位类型默认限制也包含在此比较中。

  • 组织范围的限制仍然是硬性上限。

  • 任何地方都没有限制 = 没有限制。如果成员没有个人限制,其组也没有限制,则其支出不受限制。

如何配置:组织设置 > 使用情况 > 按组。将限制设置为特定美元金额或"无限制"。

用户级支出上限

用户级上限允许您为单个账户设置消费限制。对于使用量在角色之间差异很大的组织来说,这是必不可少的——每天使用 Claude Code 的开发人员的需求与使用聊天进行文案撰写的营销人员的需求非常不同。

用户级上限的最佳实践:

  • 在推出前根据角色类型定义消费层级。分层结构——例如,轻量、标准、高级——使得更容易一致地分配和调整上限。

  • 保守开始。根据用户的请求增加上限比处理超额对话要容易得多。

  • 为高级用户(工程师、数据科学家、研究人员)提供更高或无上限的个人额度,但通过确保他们为正确的任务使用正确的Claude模型来平衡这一点。

  • 每月监控个人使用报告,以识别异常用户——既包括持续达到上限的用户(可能需要更多额度),也包括消费很少的用户(可能尚未激活)。

推荐起点

用户类型

代码

协作

聊天

高级用户(前10%)

$200

$100

$50

典型用户(平均值)

$85

$50

$20

轻度用户(中位数)

$25

$20

$5

*这些数字是粗略的规划估计。实际消费将根据您的团队规模、工作流程和使用模式而有所不同。


模型选择指南

管理员能做的最有影响力的事情之一是为用户设定明确的指导,说明哪个模型适合哪些任务。模型选择对令牌消费有直接且重大的影响——Opus在同一任务中消费的令牌数可能是Sonnet的数倍。

正确的任务用正确的模型

模型

最适合

令牌强度

推荐用途

Claude Sonnet

日常任务、写作、分析、问答

中等

所有用户的默认模型——设置为组织范围的默认值

Claude Opus

复杂推理、研究、多步骤任务

仅为高级用户或特定工作流程保留

Claude Haiku

简单查询、摘要、快速响应

大容量、轻量级自动化任务

管理员配置建议

  • 如果您有大容量、低复杂度的工作流程(例如,总结支持工单、生成初稿电子邮件),请评估Haiku是否更合适——它可以显著降低这些用例的消费。

  • 定期审计您的用户实际选择的模型。如果您的大部分消费都在Opus上,这表明您的模型指导没有得到有效传达。

关于模型选择要告诉用户的内容

Sonnet是您的日常工具。它速度快、功能强大,专为绝大多数任务设计——写作、分析、编码帮助和问答。

Opus用于更难、更复杂的工作。当您处理真正复杂的多步骤问题,或质量比速度更重要时,请使用它。

不确定时,从Sonnet开始。如果您需要更深入的分析,可以随时在对话中途切换模型到Opus。


使用组织偏好设置来塑造用户行为

组织偏好设置允许管理员在整个组织的每次Claude对话中注入常设指导——有效地为Claude提供反映您团队规范、最佳实践和护栏的系统提示。这是一个高杠杆工具,可以改变用户行为而不增加摩擦,因为指导在产品中的使用时刻显示,而不是在用户必须查找的文档中。

您可以使用组织偏好设置来管理消费和使用模式的几种方式:

  • 劝阻令牌密集型输出格式。如果您注意到特定工件类型的增加(例如,在跨职能线程中共享的HTML仪表板,而更简单的格式就足够了),您可以指示Claude在生成之前向用户确认。这增加了一个轻量级检查,而不会完全移除该功能。

  • 将用户指向内部资源。在偏好设置中直接引用您团队的wiki、最佳实践文档或使用指南。Claude会在相关时刻展示这些资源——引导用户获取正确的内部背景信息,而不是每次都重新创建。

  • 强化模型选择规范。提醒Claude(进而提醒用户)Sonnet是默认模型,Opus仅保留用于特定工作流。这可以补充用户教育,而无需每个人都提前掌握这些信息。


跟踪使用情况和支出

分析页面

用户菜单中的分析页面(claude.ai/analytics)是快速了解您组织情况的最佳方式。它显示每周活跃用户、座位利用率、热门连接器、总支出(MTD/QTD/YTD)、按模型分类的支出以及前10名按支出排名的用户排行榜。Claude.ai、Claude Code和Cowork的产品特定视图分别展示每个平台的活动情况。了解更多

支出报告CSV导出

如果您需要一次性的详细分析,可以从分析 > 所有活动 > 支出 > 导出支出将按用户、按模型的支出报告导出为CSV。选择MTD、上个月、过去90天或最多90天前的自定义范围。CSV包括用户电子邮件、用户ID、账户UUID、产品、模型、请求数、提示和完成令牌,以及USD中的净支出和总支出。

分析聊天

分析聊天让您可以用自然语言提问关于您组织的使用情况。输入一个问题——"显示过去30天的每日支出"、"谁是我们的最大支出者"、"我们的座位利用率是多少"——Claude会返回一个图表和一份关于其发现的简短书面总结。您可以跟进以优化、深入或转向新的分析,无需重新开始。

当您有特定问题且不想浏览仪表板时,或当您在探索趋势并希望快速来回交互时,请使用此功能。结果默认涵盖过去30天;如果您需要其他范围,请在问题中指定。数据每天刷新。了解更多

分析API

如需程序化访问,请使用Claude企业分析API。获取按令牌使用或美元支出排名的用户列表,或查看按产品、模型、上下文窗口或地区分类的使用和成本趋势。每个请求的时间跨度上限为31天,起始日期在过去365天内,且不早于2026年1月1日。

您的主要所有者可以生成管理员API密钥。数据每四小时刷新一次;对于发票级别的总计,请查询30天以前的日期,以便有时间处理延迟事件。了解更多并查看API参考指南


最终用户教育

技术控制可以解决大部分问题,但用户行为决定了其余部分。理解消费工作原理的团队会独立做出更好的选择——并为您减少需要排查的边界情况。

与最终用户沟通的内容

当您引入用户时,请分享以下内容:

Claude如何计费

  • 使用情况以令牌为单位进行测量。较长的提示和较长的对话会消耗更多令牌。

  • Claude Code和Cowork会话的令牌消耗量明显高于聊天。单个较长的编码会话可能会使用比典型聊天会话多得多的令牌。

  • 通过切换到设置 → 使用情况在设置中检查您的使用情况。

如何选择模型

  • Sonnet是默认模型,可以很好地处理大多数任务。仅当Sonnet无法满足您的需求时,才使用Opus。

  • 模型选择器在界面中可见——提醒用户检查它,特别是在运行复杂任务时。

  • 模型选择器是粘性的,所以养成检查它是否是您想要使用的模型的习惯!

当他们达到上限时会发生什么

  • 如果用户达到其个人上限,他们可以联系其组所有者或IT/管理团队以请求增加。

  • 他们不会丢失进行中的工作——Claude会在限制进一步使用之前完成当前轮次。

这是否解答了您的问题?