메인 콘텐츠로 건너뛰기

Claude Code의 모델, 사용법 및 제한사항

오늘 업데이트함

이 가이드는 사용 중인 모델, 사용량 측정 방식, 그리고 긴 세션을 컨텍스트 및 사용량 제한 범위 내에서 유지하는 방법을 설명합니다.


사용량 측정 방식

로그인 방식에 따라 사용량이 측정됩니다. Claude Code의 다른 모든 기능은 이와 관계없이 동일하게 작동합니다.

로그인 방식…

제공되는 것

"한도 초과"의 모습

Claude Enterprise 시트 (/login 경유)

조직 플랜에 포함된 사용량 풀로, 롤링 윈도우에서 재설정됩니다.

"한도 도달, 시간에 재설정" 메시지입니다.

API 키 (Console, Bedrock, Vertex 또는 Microsoft Foundry)

종량제로, 토큰당 해당 클라우드 또는 Console 계정으로 청구됩니다.

하드 스톱이 없으며, 계정은 사용한 만큼 청구됩니다.

Enterprise 시트로 로그인한 경우, 일반적으로 한도에 도달할 때까지 토큰에 대해 생각할 필요가 없습니다. API 키를 사용하는 경우, /cost 명령어는 현재 세션의 실행 비용을 표시합니다.


모델 선택

언제든지 /model을 실행하여 계정에서 사용 가능한 모델을 확인하고 모델 간에 전환할 수 있습니다. 대략적인 가이드는 다음과 같습니다:

  • Sonnet은 기본값이며 대부분의 코딩 작업에 적합한 선택입니다. 빠르고 강력하며 비용 효율적입니다.

  • Opus는 대규모 교차 리팩토링, 어려운 디버깅 또는 아키텍처 결정과 같은 어려운 문제에 대해 더 깊은 추론을 제공합니다. 할당량을 훨씬 더 많이 사용하므로 기본값으로 켜두지 말고 필요할 때만 전환하세요.

  • Haiku는 가장 빠르고 저렴한 옵션으로, 빠른 조회, 간단한 편집 또는 대량 스크립트 실행에 적합합니다.

세션 중간에 모델을 변경할 수 있으며 대화를 잃지 않습니다. 일반적인 패턴은 Opus로 계획하고 Sonnet으로 실행하는 것입니다.

참고: 정확한 모델 이름, 버전 및 가용성은 시간에 따라 변합니다. /model 명령어는 항상 계정의 정보 출처입니다.


실제로 토큰을 소비하는 것

매 턴마다 모델에 세 가지를 전송합니다:

  1. 지금까지의 대화 — 이 세션의 모든 이전 메시지입니다.

  2. 프로젝트 컨텍스트CLAUDE.md 및 Claude가 읽은 모든 파일입니다.

  3. 새로운 프롬프트입니다.

이 중에서 첫 번째 항목이 가장 빠르게 증가합니다. Claude가 20개 파일을 읽고 15개의 diff를 생성한 긴 디버깅 세션은 이후의 모든 메시지에서 이 모든 것을 전달합니다. 이것이 비용과 컨텍스트 제한의 출처입니다.


컨텍스트 윈도우 관리

컨텍스트 윈도우는 모델이 한 번에 고려할 수 있는 최대 텍스트 양입니다. Claude Code는 얼마나 찼는지 실시간 표시기를 보여줍니다. 가득 차면 Claude는 더 이상 대화의 가장 오래된 부분을 명확하게 볼 수 없으며 품질이 저하됩니다.

두 가지 명령어가 이를 제어합니다:

  • /clear는 대화를 지우고 새로 시작합니다. CLAUDE.md와 프로젝트 파일은 계속 사용 가능하며, 채팅 기록만 제거됩니다. 작업을 전환할 때마다 이를 사용하세요. 품질과 비용 모두에 가장 효과적인 수단입니다.

  • /compact는 지금까지의 대화를 짧은 요약으로 정리하여 공간을 확보하면서 필수 컨텍스트를 보존합니다. 작업 중간에 계속 진행해야 할 때 사용하세요. Claude Code는 한도에 가까워지면 자동으로 압축하므로 하드 벽에 거의 도달하지 않습니다.

경험 법칙: 새 작업을 시작할 때는 /clear를 사용하고, 긴 작업을 계속할 때는 /compact를 사용하세요.


사용량을 최대한 늘리는 5가지 습관

거의 모든 "점심시간까지 한도를 다 써버렸다"는 보고는 이 5가지 중 하나로 거슬러 올라갑니다.

1. 작업 간 정리

모든 이전 메시지는 매 턴마다 다시 전송되므로, 3개의 관련 없는 문제를 거쳐온 세션은 각 새 메시지에서 3개 모두에 대해 비용을 지불합니다.

실제로: 로그인 리다이렉트 디버깅을 방금 완료했고 이제 데이터베이스 마이그레이션을 작성하려고 합니다. 먼저 /clear를 실행하세요. 간단한 테스트: 다음 프롬프트가 새로운 터미널에서 완벽하게 이해가 된다면, 전송하기 전에 정리하세요. CLAUDE.md와 프로젝트 파일은 그대로 유지되며, 채팅 기록만 삭제됩니다.

한 가지 경고: /clear는 실행 취소할 수 없습니다. 기록에서 뭔가 필요할 수도 있다면, 먼저 복사하거나 /compact를 대신 실행하세요. 이는 모든 것을 지우는 대신 요약을 보존합니다.

2. 모델을 작업에 맞추기

Opus는 턴당 Sonnet보다 몇 배 더 비싸고, Sonnet은 Haiku보다 더 비쌉니다. 일상적인 작업에 Opus를 사용하는 것은 일일 한도를 소진하는 가장 빠른 방법입니다.

합리적인 기본값: 대부분의 코딩(기능, 테스트, 알려진 버그, 리팩토링)에는 Sonnet; 정말 막혔거나 변경이 광범위할 때(어려운 디버깅, 교차 리팩토링, 아키텍처 결정)에는 Opus; 빠른 기계적 작업(이름 바꾸기, 로그 라인, 정규식 설명, 보일러플레이트)에는 Haiku.

3. 파일을 붙여넣는 대신 파일을 가리키기

붙여넣은 모든 것은 세션의 나머지 동안 컨텍스트에 전체적으로 남아 있습니다. 경로로 파일을 참조하면 Claude가 선택적으로 읽고 관심 있는 부분에 집중할 수 있습니다.

실제로: auth.ts를 붙여넣는 대신, src/auth.tsvalidateToken 함수를 살펴보세요라고 작성하세요 — 경로를 언급하면 Claude가 선택적으로 열고 읽을 수 있습니다. (@ 접두사는 전체 파일과 CLAUDE.md 트리를 컨텍스트에 주입하므로, 토큰을 절약하려고 할 때는 경로 없이 사용하세요.) 로그 및 스택 추적의 경우, 붙여넣기 전에 관련된 20~30줄로 자르세요. 큰 파일(lockfile, 빌드 로그, 데이터 덤프)의 경우, 디스크에 저장하고 경로를 참조하세요.

4. CLAUDE.md 간결하게 유지

이 파일은 모든 턴에 앞에 붙습니다. 프롬프트 캐싱은 첫 번째 이후의 턴이 훨씬 저렴한 캐시 읽기 요금으로 청구되므로 달러 비용은 원시 라인 수보다 낮지만, 여전히 모든 메시지에서 컨텍스트 윈도우 공간을 차지합니다.

규칙: 2회 경고, 간결하게 유지하세요. 같은 것에 대해 Claude를 수정해야 하는 두 번째 경우에만 메모를 추가하세요(첫 번째 문제는 보통 일회성입니다). 파일을 대략 200줄 이하로 유지하세요. 새로운 것이 들어가야 하는데 공간이 없으면, 오래된 것이 나가야 합니다.

업데이트 시기: Claude를 같은 것에 대해 두 번 수정해야 했던 세션 직후입니다. 그때가 수정이 신선하고 작성하는 데 1분이 걸릴 때입니다. 몇 주마다 전체 파일을 읽고 더 이상 참이 아니거나 목적을 기억할 수 없는 것을 삭제하세요. 오래된 메모는 누락된 메모보다 나쁩니다. 왜냐하면 Claude를 적극적으로 잘못 인도하기 때문입니다.

5. 큰 변경 전에 계획 요청

계획은 몇 백 개의 토큰이 소요됩니다. 잘못된 400줄 diff를 되돌리고 다시 생성하는 데는 수천 개가 소요되며, 두 배로 더하기 무엇이 잘못되었는지 설명하는 데 소요되는 턴입니다. 실제로: 2~3개 이상의 파일을 건드리는 모든 것에 대해 Plan Mode로 전환하거나 단순히 다음을 요청하세요: "변경하기 전에 건드릴 파일과 각 파일에서 할 작업을 나열하세요." 목록을 읽고 일반 영어로 수정하세요("legacy/를 건너뛰고 아직 테스트를 건드리지 마세요"), 그 다음 실행하도록 하세요.

전문가 팁: Opus로 계획하고 Sonnet으로 실행하세요. Opus의 가장 높은 가치 사용은 계획 자체를 작성하는 것입니다. 여기서 더 깊은 추론이 실제로 효과를 발휘합니다. 좋은 계획이 존재하면, 실행은 대부분 기계적이며 Sonnet은 비용의 일부로 처리합니다. 이 패턴은 /model opusplan으로 내장되어 있으며, 계획할 때는 Opus를 사용하고 실행할 때는 Sonnet을 사용합니다. 모델을 전환해도 대화가 지워지지 않으므로 Sonnet은 여전히 Opus가 생성한 모든 것을 봅니다.


한도에 도달했을 때 할 일

  • Enterprise 시트 사용자: 메시지는 윈도우가 재설정될 때를 알려줍니다. 그 동안 /model로 더 가벼운 모델로 전환하거나, 조직에서 허용하는 경우 임시로 API 키로 돌아갈 수 있습니다.

  • API 키 사용자: 사용량 상한이 없지만, 지출이 우려된다면 /cost와 Console 또는 클라우드 제공자 대시보드를 확인하세요. 예상치 못한 높은 수치는 거의 항상 절대 정리되지 않은 매우 긴 세션으로 거슬러 올라갑니다.

  • 컨텍스트 윈도우 가득 참 (사용량 한도와는 다름): /compact를 실행하여 계속하거나, 더 이상 오래된 기록이 필요하지 않으면 /clear를 실행하세요.


빠른 참조

명령어

기능

/model

사용 가능한 모델을 보고 전환합니다.

/cost

이 세션의 토큰 및 달러 사용량을 표시합니다(API 청구).

/clear

새로운 대화를 시작합니다(프로젝트 메모리는 유지됨).

/compact

기록을 요약하여 컨텍스트를 확보합니다.

/context

현재 컨텍스트에 로드된 것을 검사합니다.

답변이 도움되었나요?