Claude Sonnet 4.5 включает новые защиты AI Safety Level 3 (ASL-3), разработанные для предотвращения неправомерного использования, связанного с химическим, биологическим, радиологическим и ядерным (CBRN) оружием. Эти меры безопасности используют Constitutional Classifiers, которые отслеживают входные и выходные данные для блокировки узкой категории вредоносного контента.

Почему мой запрос API был заблокирован?

Фильтры безопасности Sonnet 4.5 сосредоточены на предотвращении помощи в задачах, связанных с оружием CBRN. Если ваш запрос был заблокирован, фильтры обнаружили контент, соответствующий шаблонам, связанным с этими конкретными угрозами.

Эти фильтры все еще совершенствуются. Как и в любой автоматизированной системе, могут возникать ложные срабатывания — это означает, что законные запросы могут иногда быть неправильно помечены. Мы активно работаем над повышением точности этих классификаторов, чтобы минимизировать сбои при сохранении безопасности.

Что вы можете сделать

Если ваш запрос API заблокирован, вот шаги, которые вы можете предпринять:

Избегайте шаблонов, вызывающих ложные срабатывания

Классификаторы чувствительны к определенным шаблонам, которые могут напоминать попытки обхода защиты или методы обфускации:

Избегайте контента, похожего на шифр: строки в кодировке Base64, хеши коммитов git, шестнадцатеричные последовательности и другие закодированные данные могут вызвать срабатывание фильтров. Если вам нужно включить такой контент, подумайте, является ли он необходимым для вашего варианта использования.
Упростите системные инструкции: чрезмерно длинные или сложные системные подсказки, включающие сложную условную логику, могут напоминать попытки скрыть поведение. Держите системные инструкции четкими и понятными.
Будьте осторожны с контентом, связанным с биологией: если ваше приложение не требует специально биологической или химической информации, рассмотрите возможность переформулировки запросов, чтобы избежать этих тем, когда это возможно.

Переключитесь на Sonnet 4

Используйте Sonnet 4 вместо Sonnet 4.5 в ваших вызовах API. Sonnet 4 использует другие меры безопасности и может успешно обработать ваш запрос.

Реализуйте логику отката

Встройте обработку ошибок в ваше приложение, которое может:

Обнаружить, когда запрос заблокирован фильтрами безопасности.
Автоматически повторить попытку с Sonnet 4 в качестве резервного варианта.
Регистрировать инциденты для вашего анализа, чтобы выявить закономерности в ложных срабатываниях.

Предоставьте обратную связь

Если вы считаете, что ваш запрос был неправильно заблокирован, свяжитесь с нашей командой поддержки API. Ваша обратная связь помогает нам улучшить точность фильтров и снизить количество ложных срабатываний для законных вариантов использования.

Почему новые фильтры?

По мере того как модели ИИ становятся более мощными, они требуют более сильной защиты от потенциального неправомерного использования. Меры развертывания ASL-3 Sonnet 4.5 являются частью Политики ответственного масштабирования Anthropic, которая обеспечивает, чтобы все более мощные модели имели надлежащие защиты.

Фильтры специально разработаны для предотвращения расширенных, сквозных рабочих процессов CBRN, которые могут представлять катастрофические риски. Они не предназначены для блокировки общего научного обсуждения, образовательного контента или общедоступной информации.

Для исследователей и приложений двойного назначения

Если вы разрабатываете приложения для научных исследований или технологий двойного назначения и вам нужен доступ в законных целях, мы установили системы контроля доступа для проверенных пользователей. Свяжитесь с нашей командой поддержки API, чтобы узнать больше об исключениях.

Другие статьи по теме

Отчетность, блокировка и удаление контента из Claude

Наш подход к безопасности пользователей