跳至主要內容

兒童安全開發者指南

我們對兒童安全的承諾

Anthropic 採用「設計安全」方法來保護兒童安全。我們是 Thorn 和 All Tech Is Human 生成式 AI 安全設計原則的簽署方,並在 透明度中心報告我們的進展。在實踐中,這意味著我們應用安全訓練,使我們的模型拒絕將未成年人性化或危害未成年人的請求,在我們的服務中運營檢測和監控系統,並向美國失蹤與被剝削兒童中心 (NCMEC) 報告明顯的兒童性虐待材料和其他形式的兒童剝削。我們的第一方消費者服務僅限於 18 歲及以上的用戶,Claude 不會生成逼真的圖像或視頻輸出。

這些保護措施適用於我們的整個平台。由於您控制產品的設計、用戶群和內容流,您最適合解決特定於您部署的風險。

您在 Anthropic 使用政策下的義務

所有在 Anthropic API 上構建的開發者都必須遵守我們的 使用政策,該政策禁止使用我們的產品或服務危害兒童安全。這包括但不限於:創建、分發或推廣兒童性虐待材料(包括 AI 生成的兒童性虐待材料);便利對未成年人的誘騙、販運、性勒索或其他剝削;以及在任何背景下(包括虛構或角色扮演)將未成年人性化。

無論您的平台規模或使用案例如何,這些義務都適用。雖然您可能已經禁止此類活動,但您的最終用戶或客戶可能會上傳兒童性虐待材料、引發涉及未成年人的性化內容,或使用輸出便利誘騙或性勒索。您負責在您的部署中實施適當的防護措施以防止這些風險。我們監控 API 使用情況是否違反使用政策,並採取與我們的政策和法律義務一致的執法行動。

此外,如果您的產品允許未成年人直接與我們的模型互動,請參考我們的 為未成年人服務的組織指南,其中列出了 Anthropic 對該受眾的額外保護措施要求。本指南涵蓋一系列可能的措施,包括但不限於年齡驗證系統、內容審核和過濾、監控和報告機制,以及監管合規和披露要求。

無論您是否收到 Anthropic 關於禁止內容的通知,或者正在主動建立您的保護措施,以下資源可以幫助您了解如何建立適合您平台的檢測、報告和回應基礎設施。

建立兒童安全計劃

兒童安全計劃沒有單一正確的架構。可行的方法取決於您的平台、其規模、用戶可以參與、提交或生成內容的表面,以及您的司法管轄區。許多平台已經建立了適合自己背景的預防和回應能力,該領域已經開發了共享指南、工具和報告基礎設施,新計劃可以利用這些。以下組織提供許多平台用作起點的資源。Anthropic 不要求您使用任何特定的供應商或計劃。

設計原則。Thorn 和 All Tech Is Human 發布了 生成式 AI 設計安全,這是一套原則和實踐緩解措施,用於在 AI 產品的開發、部署和維護階段防止兒童性虐待。Anthropic 是這些原則的 簽署方,我們鼓勵在我們的模型上構建的開發者在設計自己的保護措施時考慮這些原則。

檢測和阻止服務。如果您的部署允許用戶上傳或生成圖像或視頻,或與其他用戶互動,您可以在自己的基礎設施上實施檢測。組織可以選擇構建針對其威脅模型的自定義分類器,但對於許多組織來說,供應商或合作夥伴解決方案可能是更實用的途徑。有多家提供商提供哈希匹配、圖像、視頻或文本分類器解決方案。例如,一個廣泛部署的選項是 Thorn 的 Safer,它提供針對已知兒童性虐待材料的哈希匹配和新材料與誘騙信號的分類器。互聯網觀察基金會 (IWF) 為其成員公司提供 一套服務,用於在其平台上檢測、阻止和回應兒童性虐待材料,包括哈希列表和 URL 阻止列表。Tech Coalition 的 Pathways 計劃(如下所述)可以幫助公司評估和訪問適合其平台的檢測選項。

計劃開發和運營指南。Tech Coalition 是一個專注於防止在線兒童性剝削和虐待的行業聯盟。其免費的 Pathways 計劃專為初創公司和中小型平台設計,提供構建兒童安全計劃的模板、關於兒童性虐待材料檢測和 NCMEC 報告的指導、對全球監管要求的洞察,以及對金融性勒索和 AI 生成傷害等新興風險的支持。Anthropic 是 Tech Coalition 成員。您可以聯繫 Tech Coalition 團隊進行初步諮詢。

報告。美國平台如果實際了解明顯的兒童性虐待材料,在法律上必須向 NCMEC 的 CyberTipline 報告。平台可以 向 NCMEC 註冊以獲得 CyberTipline 報告系統的訪問權限,NCMEC 發布了關於報告義務的額外 法律資源。在其他司法管轄區運營的平台應查詢當地報告要求;INHOPE 維護了 國家熱線目錄。在構建您的計劃時,考慮納入日誌記錄以用於透明度報告。

本頁面僅供參考之用,不構成法律建議或 Anthropic 的認可。請就您的具體義務諮詢您自己的法律顧問。

是否回答了您的問題?