이 가이드는 사용 중인 모델, 사용량 측정 방식, 그리고 긴 세션을 컨텍스트 및 사용 제한 범위 내에서 유지하는 방법을 설명합니다.
사용량 측정 방식
로그인 방식에 따라 사용량이 측정됩니다. 그 외 Claude Code의 모든 기능은 동일하게 작동합니다.
로그인 방식… | 제공되는 것 | "한도 초과"의 모습 |
Claude Enterprise 시트 ( | 조직 플랜에 포함된 사용량 풀, 롤링 윈도우에서 재설정됩니다. | "한도 도달, 시간에 재설정됨" 메시지. |
API 키 (Console, Bedrock 또는 Vertex) | 종량제, 해당 클라우드 또는 Console 계정에 토큰당 청구됩니다. | 하드 스탑 없음; 계정은 사용한 만큼 청구됩니다. |
Enterprise 시트로 로그인한 경우, 일반적으로 한도에 도달할 때까지 토큰에 대해 생각할 필요가 없습니다. API 키를 사용하는 경우, /cost 명령어는 현재 세션의 실시간 지출을 표시합니다.
모델 선택
/model을 언제든지 실행하여 계정에서 사용 가능한 모델을 확인하고 모델 간에 전환할 수 있습니다. 대략적인 가이드:
Sonnet은 기본값이며 대부분의 코딩 작업에 적합한 선택입니다. 빠르고 강력하며 비용 효율적입니다.
Opus는 대규모 교차 리팩토링, 어려운 디버깅 또는 아키텍처 결정과 같은 어려운 문제에 대해 더 깊은 추론을 제공합니다. 할당량을 훨씬 더 많이 사용하므로 기본값으로 켜두지 말고 필요할 때만 전환하세요.
Haiku는 가장 빠르고 저렴한 옵션으로, 빠른 조회, 간단한 편집 또는 대량 스크립트 실행에 적합합니다.
대화를 잃지 않고 세션 중간에 모델을 변경할 수 있습니다. 일반적인 패턴은 Opus로 계획하고 Sonnet으로 실행하는 것입니다.
참고: 정확한 모델 이름, 버전 및 가용성은 시간에 따라 변합니다. /model 명령어는 항상 계정의 정보 출처입니다.
실제로 토큰을 소비하는 것
매 턴마다 모델에 세 가지를 전송합니다:
지금까지의 대화 — 이 세션의 모든 이전 메시지.
프로젝트 컨텍스트 —
CLAUDE.md및 Claude가 읽은 모든 파일.새로운 프롬프트.
이 중 첫 번째 항목이 가장 빠르게 증가합니다. Claude가 20개 파일을 읽고 15개의 diff를 생성한 긴 디버깅 세션은 이후의 모든 메시지에서 이 모든 것을 전달합니다. 이것이 비용과 컨텍스트 제한의 출처입니다.
컨텍스트 윈도우 관리
컨텍스트 윈도우는 모델이 한 번에 고려할 수 있는 최대 텍스트 양입니다. Claude Code는 얼마나 찼는지 실시간 표시기를 보여줍니다. 가득 차면 Claude는 더 이상 대화의 가장 오래된 부분을 명확하게 볼 수 없으며 품질이 저하됩니다.
두 가지 명령어로 제어할 수 있습니다:
/clear는 대화를 지우고 새로 시작합니다.CLAUDE.md와 프로젝트 파일은 계속 사용 가능하며, 채팅 기록만 제거됩니다. 작업을 전환할 때마다 이를 사용하세요. 품질과 비용 모두에 가장 효과적인 수단입니다./compact는 지금까지의 대화를 짧은 요약으로 정리하여 공간을 확보하면서 필수 컨텍스트를 보존합니다. 작업 중간에 계속 진행해야 할 때 사용하세요. Claude Code는 한도에 가까워지면 자동으로 압축하므로 하드 벽에 거의 도달하지 않습니다.
경험의 법칙: 새 작업을 시작할 때는 /clear를 사용하고, 긴 작업을 계속할 때는 /compact를 사용하세요.
사용량을 최대한 늘리는 다섯 가지 습관
거의 모든 "점심시간까지 한도를 다 써버렸다"는 보고는 이 다섯 가지 중 하나로 거슬러 올라갑니다.
1. 작업 간 초기화
모든 이전 메시지는 매 턴마다 다시 전송되므로, 세 가지 관련 없는 문제를 거쳐온 세션은 각 새 메시지에서 세 가지 모두에 대해 비용을 지불합니다. 실제로: 로그인 리다이렉트 디버깅을 방금 완료했고 이제 데이터베이스 마이그레이션을 작성하려고 합니다. 먼저 /clear를 실행하세요. 간단한 테스트: 다음 프롬프트가 새 터미널에서 완벽하게 이해된다면, 전송하기 전에 초기화하세요. CLAUDE.md와 프로젝트 파일은 유지되고, 채팅 기록만 제거됩니다. 한 가지 경고: /clear는 실행 취소할 수 없습니다. 기록에서 뭔가 필요할 수도 있다면, 먼저 복사하거나 /compact를 대신 실행하세요. 이는 모든 것을 지우는 대신 요약을 보존합니다.
2. 모델을 작업에 맞추기
Opus는 턴당 Sonnet보다 몇 배 더 비싸고, Sonnet은 Haiku보다 더 비쌉니다. 일상적인 작업에 Opus를 사용하는 것은 일일 한도를 소진하는 가장 빠른 방법입니다. 합리적인 기본값: 대부분의 코딩(기능, 테스트, 알려진 버그, 리팩토링)에는 Sonnet; 정말 막혔거나 변경이 광범위할 때(어려운 디버깅, 교차 리팩토링, 아키텍처 결정)는 Opus; 빠른 기계적 작업(이름 바꾸기, 로그 라인, 정규식 설명, 보일러플레이트)에는 Haiku.
3. 파일을 붙여넣는 대신 파일을 가리키기
붙여넣은 모든 것은 세션의 나머지 동안 컨텍스트에 전체적으로 남아있습니다. 경로로 파일을 참조하면 Claude가 선택적으로 읽고 관심 있는 부분에 집중할 수 있습니다. 실제로: auth.ts를 붙여넣는 대신, @src/auth.ts의 validateToken 함수를 살펴보세요라고 작성하세요. 로그 및 스택 추적의 경우, 붙여넣기 전에 관련된 20~30줄로 자르세요. 큰 파일(lockfile, 빌드 로그, 데이터 덤프)의 경우, 디스크에 저장하고 경로를 참조하세요.
4. CLAUDE.md 간결하게 유지
이 파일은 모든 턴에 앞에 붙으므로, 그 비용은 전송하는 메시지 수에 따라 곱해집니다. 40턴 세션에서 300줄의 CLAUDE.md는 작업을 하기 전에 이미 지불한 12,000줄의 입력입니다. 규칙: 두 번 치면 한 화면. 같은 것에 대해 Claude를 두 번 수정해야 할 때만 메모를 추가하세요(첫 번째 문제는 보통 일회성입니다). 그리고 파일을 대략 80~100줄의 단일 화면을 넘어 증가시키지 마세요; 새로운 것이 들어가야 하는데 공간이 없으면, 오래된 것이 나가야 합니다. 업데이트 시기: 같은 것에 대해 Claude를 두 번 수정해야 했던 세션 직후. 그때가 수정이 신선하고 작성하는 데 1분이 걸릴 때입니다. 몇 주마다 전체 파일을 읽고 더 이상 사실이 아니거나 목적을 기억할 수 없는 것을 삭제하세요. 오래된 메모는 누락된 메모보다 나쁩니다. 왜냐하면 Claude를 적극적으로 잘못 인도하기 때문입니다.
5. 큰 변경 전에 계획 요청
계획은 몇 백 개의 토큰이 소요됩니다. 잘못된 400줄의 diff를 되돌리고 다시 생성하는 것은 수천 개, 두 번, 그리고 무엇이 잘못되었는지 설명하는 데 소요된 턴을 더합니다. 실제로: 2~3개 이상의 파일을 건드리는 모든 것에 대해, Plan Mode로 전환하거나 단순히 물어보세요: "변경하기 전에, 건드릴 파일과 각 파일에서 할 일을 나열하세요." 목록을 읽고, 일반 영어로 수정하고("legacy/를 건너뛰고, 아직 테스트를 건드리지 마세요"), 그 다음 실행하도록 하세요.
프로 팁: Opus로 계획하고, Sonnet으로 실행하세요. Opus의 가장 높은 가치 사용은 계획 자체를 작성하는 것입니다. 여기서 더 깊은 추론이 실제로 효과를 발휘합니다. 좋은 계획이 존재하면, 실행은 대부분 기계적이고 Sonnet은 비용의 일부로 처리합니다. 워크플로우: /model opus, 계획을 요청하고, 검토하고 수정한 다음, /model sonnet을 실행하고 "위의 계획을 실행하세요." 모델을 전환해도 대화가 지워지지 않으므로 Sonnet은 여전히 Opus가 생성한 모든 것을 볼 수 있습니다.
한도에 도달했을 때 할 일
Enterprise 시트 사용자: 메시지는 윈도우가 재설정될 때를 알려줍니다. 그 동안
/model로 더 가벼운 모델로 전환하거나, 조직에서 허용하는 경우 임시로 API 키로 폴백할 수 있습니다.API 키 사용자: 사용량 상한이 없지만, 지출이 우려된다면
/cost와 Console 또는 클라우드 제공자 대시보드를 확인하세요. 예상치 못한 높은 숫자는 거의 항상 초기화되지 않은 매우 긴 세션으로 거슬러 올라갑니다.컨텍스트 윈도우 가득 참 (사용 한도와 다름):
/compact를 실행하여 계속하거나, 더 이상 오래된 기록이 필요하지 않으면/clear를 실행하세요.
빠른 참조
명령어 | 기능 |
| 사용 가능한 모델을 확인하고 전환합니다. |
| 이 세션의 토큰 및 달러 사용량을 표시합니다 (API 청구). |
| 새로운 대화를 시작합니다 (프로젝트 메모리는 유지됨). |
| 기록을 요약하여 컨텍스트를 확보합니다. |
| 현재 컨텍스트에 로드된 것을 검사합니다. |
