개발자를 위한 아동 안전 지침

아동 안전에 대한 우리의 약속

Anthropic은 아동 안전에 대해 설계 단계부터의 안전(Safety by Design) 접근 방식을 취합니다. 우리는 Thorn과 All Tech Is Human의 생성형 AI를 위한 설계 단계부터의 안전 원칙의 서명자이며, 투명성 허브에서 우리의 진행 상황을 보고합니다. 실제로, 우리는 미성년자를 성적으로 표현하거나 위험에 빠뜨리는 요청을 거부하도록 설계된 안전 훈련을 적용하고, 우리의 서비스 전반에 걸쳐 탐지 및 모니터링 시스템을 운영하며, 명백한 CSAM 및 기타 형태의 아동 착취를 National Center for Missing & Exploited Children(NCMEC)에 보고합니다. 우리의 자사 소비자 서비스는 18세 이상의 사용자로 제한되며, Claude는 사진처럼 현실적인 이미지 또는 비디오 출력을 생성하지 않습니다.

이러한 보호 조치는 우리의 플랫폼 전체에 적용됩니다. 귀사가 제품의 설계, 사용자 기반 및 콘텐츠 흐름을 제어하므로, 귀사의 배포에 특정한 위험을 해결할 수 있는 최적의 위치에 있습니다.

Anthropic의 사용 정책에 따른 귀사의 의무

Anthropic의 API를 기반으로 구축하는 모든 개발자는 아동의 안전을 훼손하는 우리의 제품 또는 서비스 사용을 금지하는 사용 정책을 준수해야 합니다. 여기에는 특히 AI 생성 CSAM을 포함한 CSAM의 생성, 배포 또는 홍보, 미성년자의 그루밍, 인신매매, 섹스토션 또는 기타 착취 촉진, 그리고 픽션이나 롤플레이를 포함한 모든 맥락에서 미성년자의 성적 표현이 포함됩니다.

이러한 의무는 귀사의 플랫폼 규모나 사용 사례와 관계없이 적용됩니다. 귀사가 이미 이러한 활동을 금지하고 있을 수 있지만, 귀사의 최종 사용자 또는 고객이 CSAM을 업로드하거나, 미성년자와 관련된 성적 콘텐츠를 유도하거나, 출력을 그루밍이나 섹스토션을 촉진하는 데 사용할 수 있습니다. 귀사는 귀사의 배포에서 이러한 위험에 대한 적절한 보안 조치를 구현할 책임이 있습니다. 우리는 API 사용을 모니터링하여 사용 정책 위반을 확인하고 우리의 정책 및 법적 의무에 따라 집행 조치를 취합니다.

또한, 귀사의 제품이 미성년자가 우리의 모델과 직접 상호작용할 수 있도록 허용하는 경우, 미성년자를 대상으로 하는 조직을 위한 추가 보안 조치를 설정하는 미성년자 서빙 조직을 위한 지침을 참조하시기 바랍니다. 이 지침은 연령 확인 시스템, 콘텐츠 조정 및 필터링, 모니터링 및 보고 메커니즘, 규제 준수 및 공개 요구 사항을 포함하되 이에 국한되지 않는 다양한 가능한 조치를 다룹니다.

Anthropic으로부터 금지된 콘텐츠에 대한 알림을 받았거나 적극적으로 보안 조치를 구축하고 있든, 아래의 리소스는 귀사의 플랫폼에 적합한 탐지, 보고 및 대응 인프라를 구축하는 데 도움이 될 수 있습니다.

아동 안전 프로그램 구축

아동 안전 프로그램에 대한 단일한 올바른 아키텍처는 없습니다. 실행 가능한 접근 방식은 귀사의 플랫폼, 규모, 사용자가 콘텐츠를 참여하거나 제출하거나 생성할 수 있는 표면, 그리고 귀사의 관할권에 따라 달라집니다. 많은 플랫폼이 이미 자신의 맥락에 맞는 예방 및 대응 기능을 구축했으며, 이 분야는 새로운 프로그램이 활용할 수 있는 공유된 지침, 도구 및 보고 인프라를 개발했습니다. 아래의 조직들은 많은 플랫폼이 시작점으로 사용하는 리소스를 제공합니다. Anthropic은 특정 공급업체나 프로그램을 사용하도록 요구하지 않습니다.

설계 원칙. Thorn과 All Tech Is Human은 AI 제품의 개발, 배포 및 유지 단계에서 아동 성적 학대를 방지하기 위한 원칙 및 실질적인 완화 방안 세트인 생성형 AI를 위한 설계 단계부터의 안전을 발표했습니다. Anthropic은 이러한 원칙의 서명자이며, 우리의 모델을 기반으로 구축하는 개발자들이 자신의 보안 조치를 설계할 때 이를 고려할 것을 권장합니다.

탐지 및 차단 서비스. 귀사의 배포가 사용자가 이미지 또는 비디오를 업로드하거나 생성하거나 다른 사용자와 상호작용할 수 있도록 허용하는 경우, 귀사의 인프라에서 탐지를 구현할 수 있습니다. 조직은 자신의 위협 모델에 맞춘 사용자 정의 분류기를 구축하도록 선택할 수 있지만, 많은 경우 공급업체 또는 파트너 솔루션이 더 실용적인 경로일 수 있습니다. 해시 매칭, 이미지, 비디오 또는 텍스트 분류기 솔루션을 제공하는 여러 공급업체가 있습니다. 예를 들어, 널리 배포된 옵션 중 하나는 알려진 CSAM에 대한 해시 매칭과 새로운 자료 및 그루밍 신호에 대한 분류기를 제공하는 Thorn의 Safer입니다. Internet Watch Foundation(IWF)은 회원 회사에 해시 목록 및 URL 차단 목록을 포함하여 자신의 플랫폼에서 CSAM을 탐지, 차단 및 대응하기 위한 서비스 모음을 제공합니다. Tech Coalition의 Pathways 프로그램(아래 설명)은 회사가 자신의 플랫폼에 맞는 탐지 옵션을 평가하고 액세스하는 데 도움이 될 수 있습니다.

프로그램 개발 및 운영 지침. Tech Coalition은 온라인 아동 성적 착취 및 학대를 방지하는 데 중점을 두는 산업 연합입니다. 무료 Pathways 프로그램은 스타트업 및 중소 규모 플랫폼을 위해 설계되었으며, 아동 안전 프로그램 구축을 위한 템플릿, CSAM 탐지 및 NCMEC 보고에 대한 지침, 글로벌 규제 요구 사항에 대한 통찰력, 금융 섹스토션 및 AI 생성 해악과 같은 신흥 위험에 대한 지원을 제공합니다. Anthropic은 Tech Coalition 회원입니다. 초기 상담을 위해 Tech Coalition 팀에 문의할 수 있습니다.

보고. 명백한 CSAM에 대한 실제 지식을 가진 미국 기반 플랫폼은 법적으로 NCMEC의 CyberTipline에 보고해야 합니다. 플랫폼은 NCMEC에 등록하여 CyberTipline 보고 시스템에 액세스할 수 있으며, NCMEC은 보고 의무에 대한 추가 법적 리소스를 발행합니다. 다른 관할권에서 운영하는 플랫폼은 현지 보고 요구 사항을 참조해야 합니다. INHOPE는 국가 핫라인 디렉토리를 유지합니다. 프로그램을 구축할 때 투명성 보고 목적으로 로깅을 통합하는 것을 고려하십시오.

이 페이지는 정보 제공 목적으로만 제공되며 법적 조언이나 Anthropic의 승인을 구성하지 않습니다. 귀사의 특정 의무에 관해 자신의 법률 고문과 상담하십시오.