К основному содержимому

Какой размер контекстного окна на платных планах Claude?

Claude Opus 4.8, Opus 4.7, Opus 4.6 и Sonnet 4.6 поддерживают контекстное окно в 500K токенов на всех платных планах при общении с Claude. Для остальных моделей размер контекстного окна Claude составляет 200K, что означает, что он может обрабатывать 200K+ токенов (примерно 500 страниц текста или больше) при использовании платного плана Claude.

Обновление 12 июня: Мы приостановили доступ к Claude Fable 5. Узнайте больше здесь.

При использовании Claude Code с планом Pro, Max, Team или Enterprise, Claude Fable 5, Opus 4.8, Opus 4.7 и Opus 4.6 поддерживают контекстное окно в 1M токенов. Пользователи Pro должны включить кредиты использования для доступа к контекстному окну в 1M токенов для моделей Opus. Sonnet 4.6 также поддерживает контекстное окно в 1M для всех платных планов Claude на Claude Code, но кредиты использования должны быть включены для доступа к нему (кроме планов Enterprise на основе использования).

Автоматическое управление контекстом

Для пользователей платных планов с включённым выполнением кода Claude автоматически управляет контекстом вашего разговора. Когда ваш разговор приближается к лимиту контекстного окна, Claude суммирует более ранние сообщения, чтобы освободить место для нового содержимого. Это не учитывается в вашем лимите использования и позволяет разговорам продолжаться бесконечно в большинстве случаев.

Вся история вашего чата сохраняется, чтобы Claude мог на неё ссылаться, даже после того как более ранние части были суммированы. Вы можете иногда заметить, что Claude «организует свои мысли» во время длительных разговоров — это автоматическое управление контекстом в действии.

Примечание: Выполнение кода должно быть включено, чтобы автоматическое управление контекстом работало. В редких крайних случаях (например, при очень больших первых сообщениях или системных ошибках) вы всё ещё можете столкнуться с ограничениями контекстного окна.

Максимизация вашего контекстного окна

Хотя контекст управляется автоматически для большинства разговоров, вы всё ещё можете оптимизировать использование доступного пространства контекста:

  • Эффективно используйте проекты: Проекты используют поиск с дополнением поколения (RAG), что позволяет Claude работать с большими объёмами информации, загружая в контекстное окно только релевантное содержимое.

  • Держите инструкции проекта краткими: Claude работает лучше всего, когда вы используете инструкции проекта для общего контекста вашего проекта, ключевых рекомендаций и роли Claude.

  • Управляйте инструментами и соединителями: Эти функции требуют много токенов, поэтому внимание к количеству активных инструментов помогает максимизировать доступный контекст.

Нашли ответ на свой вопрос?