К основному содержимому

Модели, использование и ограничения в Claude Code

Обновлено сегодня

Это руководство объясняет, какую модель вы используете, как измеряется использование и как поддерживать длительные сеансы в пределах их ограничений контекста и использования.


Как измеряется использование

Способ входа определяет, как измеряется использование. Всё остальное в Claude Code работает одинаково независимо от этого.

Вы вошли с помощью…

Вы получаете

Как выглядит «исчерпание»

Место Claude Enterprise (через /login)

Пул использования, включённый в план вашей организации, сбрасывается в скользящем окне.

Сообщение «лимит достигнут, сброс в время».

Ключ API (Console, Bedrock, Vertex или Microsoft Foundry)

Оплата по мере использования, выставляется счёт за токены на облачный счёт или счёт Console.

Нет жёсткого ограничения; счёт взимается за то, что используется.

Если вы вошли с помощью места Enterprise, вам обычно не нужно думать о токенах, пока вы не достигнете лимита. Если вы используете ключ API, команда /cost показывает ваши текущие расходы за текущий сеанс.


Выбор модели

Запустите /model в любое время, чтобы увидеть, какие модели доступны для вашего аккаунта, и переключаться между ними. Как приблизительное руководство:

  • Sonnet — это модель по умолчанию и правильный выбор для подавляющего большинства работ по кодированию. Она быстрая, способная и экономичная.

  • Opus предлагает более глубокое рассуждение для сложных задач, таких как крупные сквозные рефакторинги, сложная отладка или архитектурные решения. Она использует значительно больше вашей квоты, поэтому переключайтесь на неё, когда она вам нужна, а не оставляйте её включённой по умолчанию.

  • Haiku — это самый быстрый и дешёвый вариант, хорошо подходящий для быстрых поисков, простых правок или высокообъёмных автоматизированных запусков.

Вы можете менять модели во время сеанса без потери разговора. Распространённый паттерн — планирование с Opus и выполнение с Sonnet.

Примечание: Точные названия моделей, версии и доступность меняются со временем. Команда /model всегда является источником истины для вашего аккаунта.


Что на самом деле потребляет токены

Каждый ход отправляет модели три вещи:

  1. Разговор до сих пор — каждое предыдущее сообщение в этом сеансе.

  2. Контекст проекта — ваш CLAUDE.md и любые файлы, которые прочитал Claude.

  3. Ваш новый запрос.

Из них первый элемент растёт быстрее всего. Длительный сеанс отладки, в котором Claude прочитал двадцать файлов и создал пятнадцать дифов, несёт всё это с собой в каждом последующем сообщении. Вот откуда берутся как стоимость, так и ограничения контекста.


Управление окном контекста

Окно контекста — это максимальное количество текста, которое модель может рассмотреть одновременно. Claude Code показывает живой индикатор того, насколько оно заполнено. Когда оно заполняется, Claude больше не может ясно видеть самые старые части разговора, и качество падает.

Две команды держат его под контролем:

  • /clear стирает разговор и начинает заново. Ваш CLAUDE.md и файлы проекта остаются доступными; удаляется только история чата. Используйте это всякий раз, когда вы переключаетесь на задачу, так как это единственный наиболее эффективный рычаг как для качества, так и для стоимости.

  • /compact суммирует разговор до сих пор в краткое резюме, освобождая место при сохранении существенного контекста. Используйте это, когда вы находитесь в середине задачи и вам нужно продолжить. Claude Code также автоматически компактирует, когда вы приближаетесь к лимиту, поэтому вы редко столкнётесь с жёсткой стеной.

Правило большого пальца: используйте /clear при запуске новой задачи и /compact при продолжении длительной.


Пять привычек, которые растягивают ваше использование дальше всего

Почти каждый отчёт «я исчерпал свой лимит к обеду» восходит к одному из этих пяти.

1. Очищайте между задачами

Каждое предыдущее сообщение переотправляется в каждом ходе, поэтому сеанс, который прошёл через три не связанные проблемы, платит за все три в каждом новом сообщении.

На практике: вы только что закончили отладку перенаправления входа и теперь хотите написать миграцию базы данных. Сначала запустите /clear. Простой тест: если ваш следующий запрос имел бы смысл в совершенно новом терминале, очистите перед отправкой. Ваш CLAUDE.md и файлы проекта остаются на месте; удаляется только история чата.

Одно предупреждение: /clear нельзя отменить. Если вам может ещё понадобиться что-то из истории, скопируйте это сначала или запустите /compact вместо этого, который сохраняет резюме, а не стирает всё.

2. Подберите модель к задаче

Opus стоит в несколько раз дороже за ход, чем Sonnet, а Sonnet дороже, чем Haiku. Трата Opus на рутинную работу — это самый быстрый способ исчерпать дневной лимит.

Разумные значения по умолчанию: Sonnet для большинства кодирования (функции, тесты, известные ошибки, рефакторинги); Opus, когда вы действительно застряли или изменение широкое (сложная отладка, сквозные рефакторинги, архитектурные решения); Haiku для быстрой механической работы (переименования, строки логов, объяснения регулярных выражений, шаблонный код).

3. Указывайте на файлы вместо их вставки

Всё, что вы вставляете, остаётся в контексте полностью для остальной части сеанса. Ссылка на файл по пути позволяет Claude читать выборочно и сосредоточиться на интересующей вас части.

На практике: вместо вставки auth.ts напишите посмотрите на функцию validateToken в src/auth.ts — упоминание пути позволяет Claude открыть и читать выборочно. (Обратите внимание, что префикс @ вводит весь файл плюс его дерево CLAUDE.md в контекст, поэтому используйте простой путь, когда вы пытаетесь сэкономить токены.) Для логов и трассировок стека обрежьте до соответствующих 20 или 30 строк перед вставкой. Для чего-либо большого (файлы блокировки, логи сборки, дампы данных) поместите на диск и ссылайтесь на путь.

4. Держите CLAUDE.md в тонусе

Этот файл добавляется в начало каждого хода. Кэширование подсказок означает, что ходы после первого выставляются по гораздо более дешёвому тарифу чтения кэша, поэтому стоимость в долларах ниже, чем предполагает количество строк, но он всё ещё занимает место в окне контекста в каждом сообщении.

Правило: два удара, держите это в тонусе. Добавляйте заметку только во второй раз, когда вам нужно исправить Claude на одно и то же (проблемы в первый раз обычно разовые). Держите файл примерно под 200 строк; если что-то новое нужно добавить и нет места, что-то старое должно выйти.

Когда обновлять: сразу после сеанса, в котором вам нужно было исправить Claude дважды на одно и то же. Вот когда исправление свежее и занимает минуту для записи. Каждые несколько недель прочитайте весь файл и удалите всё, что больше не верно или чья цель вы не помните. Устаревшие заметки хуже, чем отсутствующие заметки, потому что они активно неправильно направляют Claude.

5. Попросите план перед большими изменениями

План стоит несколько сотен токенов. Неправильный дифф из 400 строк, который вы отменяете и регенерируете, стоит тысячи, дважды, плюс ходы, потраченные на объяснение того, что пошло не так. На практике: для чего-либо, касающегося более двух или трёх файлов, переключитесь на режим плана или просто спросите: «Перед изменением чего-либо перечислите файлы, которые вы будете трогать, и что вы будете делать в каждом.» Прочитайте список, исправьте его на простом английском («пропустите legacy/ и не трогайте тесты пока»), затем позвольте ему выполняться.

Профессиональный совет: планируйте с Opus, выполняйте с Sonnet. Наиболее ценное использование Opus — это написание самого плана, где более глубокое рассуждение действительно окупается. Как только хороший план существует, выполнение в основном механическое, и Sonnet справляется с ним за часть стоимости. Этот паттерн встроен как /model opusplan, который использует Opus при планировании и Sonnet при выполнении. Переключение моделей не очищает разговор, поэтому Sonnet всё ещё видит всё, что произвёл Opus.


Что делать, когда вы достигли лимита

  • Пользователи места Enterprise: сообщение говорит вам, когда ваше окно сбросится. Тем временем вы можете переключиться на более лёгкую модель с /model, или, если ваша организация это позволяет, временно вернуться к ключу API.

  • Пользователи ключа API: нет лимита использования, но проверьте /cost и вашу консоль или панель облачного провайдера, если расходы вызывают беспокойство. Неожиданно высокие числа почти всегда восходят к очень длительным сеансам, которые никогда не очищались.

  • Окно контекста заполнено (что отличается от лимита использования): запустите /compact, чтобы продолжить, или /clear, если более старая история больше не нужна.


Краткая справка

Команда

Что она делает

/model

Посмотрите и переключайте доступные модели.

/cost

Показать использование токенов и долларов в этом сеансе (выставление счётов по API).

/clear

Начните свежий разговор (память проекта остаётся).

/compact

Суммируйте историю, чтобы освободить контекст.

/context

Проверьте, что в настоящее время загружено в контекст.

Нашли ответ на свой вопрос?