메인 콘텐츠로 건너뛰기

Claude API에 대한 속도 제한 접근 방식

오늘 업데이트함

귀하의 요청 제한은 사용 계층에 따라 달라지며, 현재 세 가지 주요 지표로 측정됩니다:

  1. 분당 요청 수(RPM)

  2. 분당 입력 토큰 수(ITPM)

  3. 분당 출력 토큰 수(OTPM)

이러한 요청 제한 중 하나를 초과하면 어느 요청 제한이 초과되었는지 설명하는 429 오류와 대기 시간을 나타내는 retry-after 헤더를 받게 됩니다.

요청 제한은 조직 수준에서 설정되며 사용 계층으로 정의됩니다. 각 계층은 서로 다른 지출 및 요청 제한을 가지며, 사용 임계값에 따라 Tier 4까지 자동으로 계층이 상향됩니다.

Claude Console에서 조직의 현재 계층 및 제한을 확인할 수 있습니다.

사용 계층 및 요청 제한에 대한 자세한 정보는 Claude 문서에서 찾을 수 있습니다.

답변이 도움되었나요?