귀하의 요청 제한은 사용 계층에 따라 달라지며, 현재 세 가지 주요 지표로 측정됩니다:
분당 요청 수(RPM)
분당 입력 토큰 수(ITPM)
분당 출력 토큰 수(OTPM)
이러한 요청 제한 중 하나를 초과하면 어느 요청 제한이 초과되었는지 설명하는 429 오류와 대기 시간을 나타내는 retry-after 헤더를 받게 됩니다.
요청 제한은 조직 수준에서 설정되며 사용 계층으로 정의됩니다. 각 계층은 서로 다른 지출 및 요청 제한을 가지며, 사용 임계값에 따라 Tier 4까지 자동으로 계층이 상향됩니다.
Claude Console에서 조직의 현재 계층 및 제한을 확인할 수 있습니다.
사용 계층 및 요청 제한에 대한 자세한 정보는 Claude 문서에서 찾을 수 있습니다.
