Руководство по безопасности детей для разработчиков

Наши обязательства по безопасности детей

Anthropic применяет подход «Безопасность по дизайну» к защите детей. Мы подписали принципы безопасности по дизайну Thorn и All Tech Is Human для генеративного ИИ и отчитываемся о нашем прогрессе в Центре прозрачности. На практике это означает, что мы применяем обучение безопасности, предназначенное для того, чтобы наши модели отказывали в запросах, которые сексуализируют или подвергают опасности несовершеннолетних, управляем системами обнаружения и мониторинга во всех наших сервисах и сообщаем об очевидном CSAM и других формах эксплуатации детей в Национальный центр поиска пропавших и эксплуатируемых детей (NCMEC). Наши потребительские сервисы первой стороны ограничены пользователями в возрасте 18 лет и старше, и Claude не создает фотореалистичные изображения или видеоконтент.

Эти защиты применяются на всей нашей платформе. Поскольку вы контролируете дизайн вашего продукта, базу пользователей и потоки контента, вы находитесь в лучшем положении для решения рисков, специфичных для вашего развертывания.

Ваши обязательства в соответствии с Политикой использования Anthropic

Все разработчики, создающие приложения на API Anthropic, обязаны соблюдать нашу Политику использования, которая запрещает использование наших продуктов или сервисов для компрометации безопасности детей. Это включает, среди прочего, создание, распространение или продвижение CSAM, включая созданный ИИ CSAM; содействие ухаживанию, торговле людьми, сексторшену или другой эксплуатации несовершеннолетнего; и сексуализацию несовершеннолетних в любом контексте, включая художественную литературу или ролевые игры.

Эти обязательства применяются независимо от размера вашей платформы или сценария использования. Хотя вы можете уже запретить эту деятельность, ваши конечные пользователи или клиенты могут загружать CSAM, запрашивать сексуализированный контент, связанный с несовершеннолетними, или использовать выходные данные для содействия ухаживанию или сексторшену. Вы несете ответственность за внедрение надлежащих защитных мер против этих рисков при развертывании. Мы отслеживаем использование API на предмет нарушений Политики использования и принимаем меры по обеспечению соответствия в соответствии с нашей политикой и юридическими обязательствами.

Кроме того, если ваш продукт позволяет несовершеннолетним напрямую взаимодействовать с нашими моделями, пожалуйста, обратитесь к нашему Руководству для организаций, обслуживающих несовершеннолетних, в котором изложены дополнительные защиты, требуемые Anthropic для этой аудитории. Это руководство охватывает ряд возможных мер, включая, но не ограничиваясь, системы проверки возраста, модерацию и фильтрацию контента, механизмы мониторинга и отчетности, а также требования нормативного соответствия и раскрытия информации.

Независимо от того, получили ли вы уведомление от Anthropic о запрещенном контенте или активно создаете свои защиты, приведенные ниже ресурсы помогут вам разобраться в создании инфраструктуры обнаружения, отчетности и реагирования, подходящей для вашей платформы.

Создание программы безопасности детей

Не существует единственно правильной архитектуры для программы безопасности детей. Жизнеспособный подход зависит от вашей платформы; ее размера; поверхностей, где пользователи могут взаимодействовать, отправлять или создавать контент; и вашей юрисдикции. Многие платформы уже создали возможности предотвращения и реагирования, подходящие для их собственных контекстов, и в этой области разработано общее руководство, инструменты и инфраструктура отчетности, которые могут использовать новые программы. Организации, перечисленные ниже, предлагают ресурсы, которые многие платформы используют в качестве отправной точки. Anthropic не требует использования какого-либо конкретного поставщика или программы.

Принципы дизайна. Thorn и All Tech Is Human опубликовали Безопасность по дизайну для генеративного ИИ, набор принципов и практических мер по предотвращению сексуального насилия над детьми на этапах разработки, развертывания и поддержки продукта ИИ. Anthropic является подписантом этих принципов, и мы рекомендуем разработчикам, создающим приложения на наших моделях, рассмотреть их при разработке собственных защит.

Сервисы обнаружения и блокировки. Если ваше развертывание позволяет пользователям загружать или создавать изображения или видео, или взаимодействовать с другими пользователями, вы можете реализовать обнаружение на собственной инфраструктуре. Организации могут выбрать создание пользовательских классификаторов, адаптированных к их модели угроз, хотя для многих решение поставщика или партнера может быть более практичным путем. Существует несколько поставщиков, предлагающих решения для сопоставления хешей, классификаторы изображений, видео или текста. Например, одним из широко развернутых вариантов является Safer от Thorn, который обеспечивает сопоставление хешей с известным CSAM и классификаторы для нового материала и сигналов ухаживания. Фонд Internet Watch Foundation (IWF) предлагает своим компаниям-членам набор сервисов для обнаружения, блокировки и реагирования на CSAM на их платформах, включая списки хешей и список блокировки URL. Программа Pathways коалиции Tech Coalition (описана ниже) может помочь компаниям оценить и получить доступ к вариантам обнаружения, подходящим для их платформы.

Разработка программы и операционное руководство. Tech Coalition — это промышленный альянс, сосредоточенный на предотвращении онлайн-сексуального насилия и жестокого обращения с детьми. Его бесплатная программа Pathways предназначена для стартапов и малых и средних платформ и предоставляет шаблоны для создания программы безопасности детей, руководство по обнаружению CSAM и отчетности в NCMEC, информацию о глобальных нормативных требованиях и поддержку по возникающим рискам, таким как финансовый сексторшен и вред, вызванный ИИ. Anthropic является членом Tech Coalition. Вы можете связаться с командой Tech Coalition для первичной консультации.

Отчетность. Платформы, базирующиеся в США и имеющие фактическое знание об очевидном CSAM, по закону обязаны сообщать в CyberTipline NCMEC. Платформы могут зарегистрироваться в NCMEC, чтобы получить доступ к системе отчетности CyberTipline, и NCMEC публикует дополнительные юридические ресурсы по обязательствам по отчетности. Платформы, работающие в других юрисдикциях, должны проконсультироваться с местными требованиями по отчетности; INHOPE ведет справочник национальных горячих линий. При разработке вашей программы рассмотрите возможность включения логирования в целях прозрачной отчетности.

Эта страница предоставляется в информационных целях и не является юридической консультацией или одобрением Anthropic. Проконсультируйтесь со своим юридическим консультантом относительно ваших конкретных обязательств.

Другие статьи по теме

Обнаружение и отчетность по CSAM

Инструменты защиты API

Ответственное использование моделей Anthropic: Руководство для организаций, обслуживающих несовершеннолетних

Программа вознаграждения за обнаружение уязвимостей безопасности модели

Руководство по безопасности соединителя Microsoft 365