Модели, использование, ограничения в Claude Code

Это руководство объясняет, какую модель вы используете, как измеряется использование и как поддерживать длительные сеансы в пределах их контекста и ограничений использования.

Как измеряется использование

Способ входа определяет, как измеряется использование. Всё остальное в Claude Code работает одинаково независимо от этого.

Вы вошли с помощью…	Вы получаете	Как выглядит «исчерпание»
Место Claude Enterprise (через `/login`)	Пул использования, включённый в план вашей организации, сбрасывается в скользящем окне.	Сообщение «ограничение достигнуто, сброс в время».
Ключ API (Console, Bedrock или Vertex)	Оплата по мере использования, выставляется счёт за токены на облачный счёт или счёт Console.	Нет жёсткой остановки; счёт взимается за то, что используется.

Если вы вошли с помощью места Enterprise, вам обычно не нужно думать о токенах, пока вы не достигнете ограничения. Если вы используете ключ API, команда /cost показывает ваши текущие расходы за текущий сеанс.

Выбор модели

Запустите /model в любое время, чтобы увидеть, какие модели доступны для вашего аккаунта, и переключаться между ними. Как приблизительное руководство:

Sonnet — это модель по умолчанию и правильный выбор для подавляющего большинства работ по кодированию. Она быстрая, способная и экономичная.
Opus предлагает более глубокое рассуждение для сложных задач, таких как крупные сквозные рефакторинги, сложная отладка или архитектурные решения. Она использует значительно больше вашей квоты, поэтому переключайтесь на неё, когда она вам нужна, а не оставляйте её включённой по умолчанию.
Haiku — это самый быстрый и дешёвый вариант, хорошо подходящий для быстрых поисков, простых правок или высокообъёмных автоматизированных запусков.

Вы можете менять модели во время сеанса без потери разговора. Распространённый паттерн — планирование с Opus и выполнение с Sonnet.

Примечание: Точные названия моделей, версии и доступность меняются со временем. Команда /model всегда является источником истины для вашего аккаунта.

Что на самом деле потребляет токены

Каждый ход отправляет модели три вещи:

Разговор до сих пор — каждое предыдущее сообщение в этом сеансе.
Контекст проекта — ваш CLAUDE.md и любые файлы, которые прочитал Claude.
Ваш новый запрос.

Из них первый элемент растёт быстрее всего. Длительный сеанс отладки, в котором Claude прочитал двадцать файлов и создал пятнадцать дифов, несёт всё это с собой в каждом последующем сообщении. Вот откуда берутся как стоимость, так и ограничения контекста.

Управление окном контекста

Окно контекста — это максимальное количество текста, которое модель может рассмотреть одновременно. Claude Code показывает живой индикатор того, насколько оно заполнено. Когда оно заполняется, Claude больше не может ясно видеть самые старые части разговора, и качество падает.

Две команды держат его под контролем:

/clear стирает разговор и начинает заново. Ваш CLAUDE.md и файлы проекта остаются доступными; удаляется только история чата. Используйте это всякий раз, когда вы переключаетесь на задачу, так как это единственный наиболее эффективный рычаг как для качества, так и для стоимости.
/compact суммирует разговор до сих пор в краткое резюме, освобождая место при сохранении существенного контекста. Используйте это, когда вы находитесь в середине задачи и вам нужно продолжить. Claude Code также автоматически компактирует, когда вы приближаетесь к ограничению, поэтому вы редко столкнётесь с жёсткой стеной.

Правило большого пальца: используйте /clear при запуске новой задачи и /compact при продолжении длительной.

Пять привычек, которые растягивают ваше использование дальше всего

Почти каждый отчёт «я исчерпал свой лимит к обеду» восходит к одному из этих пяти.

1. Очищайте между задачами

Каждое предыдущее сообщение переотправляется при каждом ходе, поэтому сеанс, который прошёл через три не связанные проблемы, платит за все три при каждом новом сообщении. На практике: вы только что закончили отладку перенаправления входа и теперь хотите написать миграцию базы данных. Сначала запустите /clear. Простой тест: если ваш следующий запрос имел бы смысл в совершенно новом терминале, очистите перед отправкой. Ваш CLAUDE.md и файлы проекта остаются на месте; удаляется только история чата. Одно предупреждение: /clear нельзя отменить. Если вам может всё ещё понадобиться что-то из истории, скопируйте это сначала или вместо этого запустите /compact, который сохраняет резюме, а не стирает всё.

2. Подберите модель к работе

Opus стоит в несколько раз дороже за ход, чем Sonnet, а Sonnet дороже, чем Haiku. Трата Opus на рутинную работу — это самый быстрый способ исчерпать дневной лимит. Разумные значения по умолчанию: Sonnet для большинства кодирования (функции, тесты, известные ошибки, рефакторинги); Opus, когда вы действительно застряли или изменение широкое (сложная отладка, сквозные рефакторинги, архитектурные решения); Haiku для быстрой механической работы (переименования, строки логов, объяснения регулярных выражений, шаблонный код).

3. Указывайте на файлы вместо их вставки

Всё, что вы вставляете, остаётся в контексте полностью для остальной части сеанса. Ссылка на файл по пути позволяет Claude читать выборочно и сосредоточиться на интересующей вас части. На практике: вместо вставки auth.ts напишите look at the validateToken function in @src/auth.ts. Для логов и трассировок стека обрежьте до соответствующих 20 или 30 строк перед вставкой. Для чего-либо большого (файлы блокировки, логи сборки, дампы данных) поместите на диск и ссылайтесь на путь.

4. Держите CLAUDE.md в тонусе

Этот файл добавляется в начало каждого хода, поэтому его стоимость умножается на количество отправляемых сообщений. CLAUDE.md из 300 строк в сеансе из 40 ходов — это 12 000 строк входных данных, за которые вы заплатили перед выполнением какой-либо работы. Правило: два удара, один экран. Добавляйте заметку только во второй раз, когда вам нужно исправить Claude на одно и то же (проблемы в первый раз обычно разовые). И никогда не позволяйте файлу расти больше одного экрана примерно из 80–100 строк; если что-то новое нужно добавить и нет места, что-то старое должно выйти. Когда обновлять: сразу после сеанса, в котором вам нужно было исправить Claude дважды на одно и то же. Вот когда исправление свежее и занимает минуту на запись. Каждые несколько недель прочитайте весь файл и удалите всё, что больше не верно или чьё назначение вы не помните. Устаревшие заметки хуже, чем отсутствующие заметки, потому что они активно неправильно направляют Claude.

5. Попросите план перед большими изменениями

План стоит несколько сотен токенов. Неправильный дифф из 400 строк, который вы отменяете и регенерируете, стоит тысячи, дважды, плюс ходы, потраченные на объяснение того, что пошло не так. На практике: для чего-либо, касающегося более двух или трёх файлов, переключитесь на режим плана или просто спросите: «Перед изменением чего-либо перечислите файлы, которые вы будете трогать, и что вы будете делать в каждом.» Прочитайте список, исправьте его на простом английском («пропустите legacy/ и не трогайте тесты пока»), затем позвольте ему выполниться.

Совет профессионала: планируйте с Opus, выполняйте с Sonnet. Наиболее ценное использование Opus — это написание самого плана, где более глубокое рассуждение действительно окупается. Как только хороший план существует, выполнение в основном механическое, и Sonnet справляется с ним за часть стоимости. Рабочий процесс: /model opus, попросите план, просмотрите и исправьте его, затем /model sonnet и «выполните план выше.» Переключение моделей не очищает разговор, поэтому Sonnet всё ещё видит всё, что произвёл Opus.

Что делать, когда вы достигли ограничения

Пользователи места Enterprise: сообщение говорит вам, когда ваше окно сбросится. Тем временем вы можете переключиться на более лёгкую модель с /model или, если ваша организация это позволяет, временно вернуться к ключу API.
Пользователи ключа API: нет ограничения на использование, но проверьте /cost и вашу панель Console или облачного провайдера, если расходы вызывают беспокойство. Неожиданно высокие числа почти всегда восходят к очень длительным сеансам, которые никогда не очищались.
Окно контекста заполнено (что отличается от ограничения использования): запустите /compact, чтобы продолжить, или /clear, если более старая история больше не нужна.

Краткая справка

Команда	Что она делает
`/model`	Посмотрите и переключайте доступные модели.
`/cost`	Показать использование токенов и долларов в этом сеансе (выставление счётов по API).
`/clear`	Начните новый разговор (память проекта остаётся).
`/compact`	Суммируйте историю, чтобы освободить контекст.
`/context`	Проверьте, что в настоящее время загружено в контекст.

Другие статьи по теме

Конфигурация модели Claude Code

Claude Code - Часто задаваемые вопросы

Шпаргалка Claude Code

Советы опытного пользователя Claude Code

Часто задаваемые вопросы Claude Code