Claude Enterprise 消费指南 | Anthropic Help Center

Claude Enterprise 为您的组织提供跨聊天、Claude Code 和 Claude Cowork 的强大 AI 访问权限。随之而来的是有效管理消费的责任——确保您的团队获得最大价值，同时保持使用可预测且在预算范围内。

本指南引导 Enterprise 管理员了解可用于控制和优化 token 消费的关键杠杆：设置支出上限、配置基于角色的访问控制、用户教育以及为正确的任务选择合适的模型和工作量级别。

为什么消费管理很重要

Claude Enterprise 采用按座位、基于使用量的定价模式。您组织的消费池在所有用户之间共享，某些界面——特别是 Claude Code 和 Cowork——的 token 消耗速率明显高于标准聊天。

主动配置支出限制并对用户进行教育的管理员可以减少浪费，并确保高价值用例获得所需的容量。

了解不同界面的 token 强度

界面	Token 强度及其驱动因素
核心聊天	强度较低。标准的来回对话、摘要、起草和问答。Token 使用量随消息长度和对话历史而变化。
Claude Code	强度较高。每个编码会话包括系统提示、文件上下文、工具调用和多轮推理——每个会话的 token 数量比聊天多。
Claude Cowork	强度较高。代理工作流、多步骤任务执行和技能生成大量中间 token 使用，这些可能对最终用户不可见。

管理员提示：与您的团队设定期望

运行 Claude Code 或 Cowork 工作流的用户可能没有意识到他们的会话有多么耗费 token。单个 Cowork 任务或 Claude Code 调试会话可能消耗比聊天多得多的 token。在您发送的任何用户入职信息中包含此上下文。

基于角色的访问控制

基于角色的访问控制 (RBAC) 允许您对用户进行分组，并以单位形式而非逐个管理他们对 Claude 界面和消费预算的访问权限。这是在大型组织中管理使用的最可扩展方式。

如何构建组

根据工作职能和用例而非组织层级来考虑组。以下是一些原则：

创建映射到不同使用模式的组，而非组织结构图框。对于消费管理，"工程"和"销售"比"北美"和"欧中东非"更有用。
限制组的增殖。超过 8-10 个组会变得难以管理。从 4-6 个开始，仅在使用模式明显不同时才进行拆分。
使用组来限制对高强度界面的访问。例如：仅"工程"组的成员可以访问 Claude Code；其他用户只能看到聊天和 Cowork。
将组级支出上限作为起点分配，然后在用户级别为异常值进行覆盖（例如，需要 Claude Code 进行特定项目的非技术产品经理）。

组支出管理

配置组后：

在初始推出期间每周审查组消费，之后每月审查一次。
当一个组持续接近其上限时，在自动提高之前进行调查——正确的响应可能是模型指导（使用 Sonnet 而非 Opus）而非更多预算。
考虑在每个部门分配一个"组所有者"，负责审查使用情况并回答团队的问题。这分散了管理负担，并让具有业务背景的人参与其中。请注意，这需要为这些人员提供管理员权限，这可能不是所需的。

治理提示：将界面访问作为第一道关卡

在担心 token 级别的限制之前，请确保合适的人员可以访问合适的界面。在第一天就给所有人 Claude Code 和 Cowork 访问权限是生成意外消费的最快方式。分阶段推出高强度界面，从最可能有效使用它们的团队开始。

设置支出限制

支出限制是控制消费的主要工具。Claude Enterprise 允许管理员在三个级别设置限制：组织级别、组级别（使用 RBAC）和单个用户级别。我们推荐的方法是从 RBAC 组级别限制和按用户限制开始——这些提供精确、有针对性的控制，而不会因为达到限制而冒着切断整个组织的风险。

组织级支出限制

组织级限制可作为所有用户和界面的硬性上限，但要谨慎使用：达到它会同时影响所有人，这可能会造成中断。大多数管理员发现在组和用户级别管理消费能获得更好的结果，同时降低运营风险。

组支出限制

组支出限制允许您为整个组分配每用户每月支出限制，因此该组的每个成员都继承相同的限制，无需单独设置。这是在中大型组织中管理消费的最可扩展方式，也是管理员应该开始的地方。

请注意以下优先级规则：

个人限制始终覆盖组限制，无论哪个更高。
如果用户属于具有不同限制的多个组，支出默认值下的多组支出限制设置控制应用更高还是更低的限制。座位类型默认限制包含在此比较中。
组织范围的限制仍然是硬性上限。
任何地方都没有限制 = 没有限制。如果成员没有个人限制，其组也没有限制，则其支出不受限制。

如何配置：组织设置 → 使用情况 → 按组。将限制设置为特定美元金额或"无限制"。

用户级支出上限

用户级上限允许您为单个账户设置消费限制。对于使用量在角色间差异很大的组织来说，这是必不可少的——每天使用 Claude Code 的开发人员的需求与使用聊天进行文案撰写的营销人员的需求非常不同。

用户级上限的最佳实践：

在推出前根据角色类型定义消费层级。分层结构——例如，轻量、标准、高级——使得更容易一致地分配和调整上限。
保守开始。根据用户的请求增加上限比处理超额对话要容易得多。
为高级用户（工程师、数据科学家、研究人员）提供更高或无上限的个人额度，但通过确保他们为正确的任务使用正确的Claude模型来抵消这一点。
每月监控个人使用报告，以识别异常用户——既包括持续达到上限的用户（可能需要更多额度），也包括消费很少的用户（可能尚未激活）。

推荐起点

用户类型	代码	协作	聊天
高级（前10%）	$500	$100	$90
典型（平均值）	$215	$40	$30
轻度（中位数）	$40	$10	$5

*这些数字是粗略的规划估计。实际消费将根据您的团队规模、工作流程和使用模式而有所不同。

模型选择指南

管理员能做的最有影响力的事情之一是为用户设定明确的指导，说明哪个模型适合哪些任务。模型选择对令牌消费有直接且重大的影响——Opus在同一任务中消耗的令牌可能是Sonnet的数倍。

努力程度是第二个消费杠杆。用户可以选择Claude对每个响应应用多少思考，更高的努力程度比更低的努力程度消耗更多令牌。鼓励用户仅在最具挑战性的任务中保留最大努力，并在日常任务中使用较低的努力程度。

正确任务的正确模型

模型	最适合	令牌强度	推荐用途
Claude Fable	长期代理编码工作和推理任务	非常高	保留用于您最高价值、最复杂的代理工作。高级定价和比Opus更快的使用速度。
Claude Opus	复杂推理、研究、多步骤任务	高	仅保留给高级用户或特定工作流程
Claude Sonnet	日常任务、写作、分析、问答	中等	所有用户的默认模型——设置为您的组织范围默认值（见下文）
Claude Haiku	简单查询、摘要、快速响应	低	大容量、轻量级自动化任务

设置您的组织默认模型（测试版）

除了引导用户选择正确的模型外，您还可以为组织中的所有人设置新对话开始时使用的模型。这是可用的最直接的消费杠杆之一——默认值决定了大多数用户每天运行的内容。

您有两个选项：

Anthropic推荐——在新模型发布时自动更新，因此您的组织始终使用我们当前推荐的通用模型，无需手动维护。
选择您自己的——将特定模型设置为组织默认值，并保持不变直到您更改它。当您想要标准化为已知模型以实现消费可预测性时使用此选项（例如，默认使用Sonnet而不是Opus）。

此设置仅适用于聊天和协作。Claude代码模型默认值通过托管设置单独管理。

您也可以通过自定义角色按角色设置模型默认值，这样不同的团队可以从不同的模型开始——例如，将您的工程团队默认设置为一个模型，而将组织的其余部分设置为另一个模型。这与您已配置的 RBAC 组自然配对（请参阅第 2 部分）。

配置方法：组织设置 → 模型。

注意：用户对新对话的当前模型选择可能会被清除，因此他们将在下次对话时采用组织默认值。

管理您的组织的模型访问权限

除了设置默认值外，您还可以限制哪些模型可用——这是比仅指导更强有力的杠杆。这在两个级别上工作：

组织级别：每个模型对所有人（包括所有者和管理员）启用或禁用。在此处禁用模型会将其从整个组织的每个选择器中删除。
自定义角色级别：对于自定义角色的成员，每个角色授予对组织级别启用的子集的访问权限。角色无法授予组织已禁用的模型——组织设置始终是上限。

注意：Haiku 模型始终对每个成员可用，无法禁用，因此始终有一个备用模型。

如果成员属于具有不同自定义角色的多个组，访问权限是累加的——他们获得其任何角色授予的每个模型（只要它在组织范围内启用）。

按角色限制工作量级别

除了限制角色可以使用的模型外，您还可以限制该角色的成员每个模型可以选择的最大工作量级别——这是上面已涵盖的工作量指导的更精细版本。这仅适用于自定义角色，不适用于组织级别。如果成员有多个角色，这些角色中最高的工作量上限获胜。

管理员提示：配对模型 + 工作量限制

如果模型指导（"Sonnet 是您的默认值"消息）没有奏效，您仍然看到大量 Opus 消耗，限制 Opus 访问权限到特定角色——或将工作量限制为中等/高而不是非高级用户角色的最大值——是下一个杠杆。为深度推理真正有回报的角色保留完全访问权限。

适用范围

模型访问和工作量限制在聊天（网络、桌面、移动）、Claude Cowork、Office Agents 和 Claude Code（CLI 2.1.196+——早期版本仍显示受限选项，但使用它们的请求被拒绝）中强制执行。Claude in Chrome、Claude Design 和 Claude Security 尚不支持此功能。

配置方法：组织设置 → 角色 → 选择一个角色 → 模型选项卡。设置模型访问、每个模型的可选工作量上限和可选的角色级别默认模型。要管理整个组织的配置，请转到组织设置 → 模型。更多详情请参阅管理您的组织的模型访问权限。

管理员配置建议

如果您有高容量、低复杂度的工作流（例如，总结支持工单、生成初稿电子邮件），请评估 Haiku 是否更合适——它可以显著降低这些用例的消耗。
定期审计您的用户实际选择的模型。如果您的大部分消耗都在 Opus 上，这表明您的模型指导没有奏效。

向用户说明模型选择

Sonnet 是您的日常驱动程序。它速度快、功能强大，专为绝大多数任务而设计——写作、分析、编码帮助和问答。

Opus 用于更难、更复杂的工作。当您处理真正复杂的多步骤问题，或当质量比速度更重要时，请使用它。

如有疑问，请从 Sonnet 开始。如果您需要更深入的内容，您可以随时在对话中途将模型切换到 Opus。

使用组织偏好设置来塑造用户行为

组织偏好设置允许管理员在整个组织的每个 Claude 对话中注入常设指导——有效地给 Claude 一个系统提示，反映您团队的规范、最佳实践和护栏。这是一个高杠杆工具，用于改变用户行为而不增加摩擦，因为指导在产品中的使用时刻显示，而不是在用户必须查找的文档中。

您可以使用组织偏好设置来管理消耗和使用模式的几种方式：

反对令牌密集型输出格式。如果您注意到特定工件类型的增加（例如，在更简单的格式就足够的跨职能线程中共享的 HTML 仪表板），您可以指示 Claude 在生成之前与用户确认。这增加了一个轻量级检查，而不会完全删除该功能。
将用户指向内部资源。在偏好设置中直接引用您团队的 wiki、最佳实践文档或使用指南。Claude 将在相关时显示它们——将用户引导到正确的内部背景，而不是每次都重新发明。
强化模型选择规范。提醒 Claude（进而提醒用户）Sonnet 是默认值，Opus 保留用于特定工作流。这补充了用户教育，而不需要每个人预先内化它。

跟踪使用情况和支出

分析页面

用户菜单中的分析页面（claude.ai/analytics）是快速了解您的组织的最快方式。它显示每周活跃用户、座位利用率、顶级连接器、总支出（MTD/QTD/YTD）、按模型的支出和前 10 名按支出排名的用户排行榜。Claude.ai、Claude Code 和 Cowork 的产品特定视图分解了每个表面的活动。了解更多。

支出报告 CSV 导出

如果您需要一次性详细分解，您可以从分析 → 所有活动 → 支出 → 导出支出将每个用户、每个模型的支出报告导出为 CSV。选择 MTD、上个月、过去 90 天或最多 90 天前的自定义范围。CSV 包括用户电子邮件、用户 ID、帐户 UUID、产品、模型、请求计数、提示和完成令牌，以及美元净支出和总支出。

分析聊天

分析聊天允许您用纯语言提出有关您的组织使用情况的问题。输入一个问题——"显示过去 30 天的每日支出"、"谁是我们的最大支出者"、"我们的座位利用率是多少"——Claude 返回一个图表和它发现的内容的简短书面摘要。您可以跟进以细化、深入或转向而无需重新开始。

当您有特定问题且不想导航仪表板时，或当您探索趋势并想要快速来回时，请使用此功能。结果默认涵盖过去 30 天；如果您需要，请在您的问题中指定不同的范围。数据每天刷新。了解更多。

分析 API

对于程序化访问，请使用 Claude Enterprise Analytics API。拉取按令牌使用或美元支出排名的用户列表，或查看按产品、模型、上下文窗口或地区分解的使用和成本趋势。每个请求的宽度上限为 31 天，从过去 365 天内开始，不早于 2026 年 1 月 1 日。

您的主要所有者可以生成管理员 API 密钥。数据每四小时刷新一次；对于发票级别的总计，查询 30 天以前的日期，以便晚期事件有时间协调。了解更多并查看API 参考指南。

最终用户教育

技术控制将让您走大部分路，但用户行为驱动其余的。理解消耗如何工作的团队将独立做出更好的选择——并为您提出更少的边界情况来排除故障。

与最终用户沟通的内容

当您入职用户时，请分享以下内容：

Claude 如何计费

使用情况以令牌为单位。长提示和长对话消耗更多令牌。
Claude Code 和 Cowork 会话的令牌密集程度明显高于聊天。单个长编码会话可以使用比典型聊天会话多得多的令牌。
通过切换到设置 → 使用情况在设置中检查您的使用情况。

如何选择模型

Sonnet 是默认值，可以很好地处理大多数任务。仅当 Sonnet 无法让您达到需要的地方时，才使用 Opus。
您的组织为新对话设置了默认模型；您仍然可以在对话中途切换模型以满足特定任务的需求。
模型选择器在界面中可见——提醒用户检查它，特别是在运行复杂任务时。
模型选择器是粘性的，因此养成检查它是否是您想要使用的模型的习惯。
努力级别显示在模型名称旁边。更高的努力意味着更全面的响应，但令牌消耗也更高，因此应与任务相匹配。

达到上限时会发生什么

如果用户达到其个人上限，他们可以联系其组所有者或IT/管理团队以请求增加。
他们不会丢失进行中的工作——Claude将在限制进一步使用之前完成当前轮次。

在 Team 或 Enterprise 计划中使用 Claude Code

Claude 非营利组织版入门指南

在 Team 和 Enterprise 计划中使用 Claude Cowork

Claude for Government 中的模型可用性

Claude Design 管理员指南（Team 和 Enterprise 计划）