跳至主要內容

API 安全防護工具

本週已更新

無論您是剛開始為 Claude 的 API 部署設置保障措施,還是您的部署已經在運行,以下是在構建自己的 AI 安全計劃時應考慮的一些策略。這些建議旨在幫助您遵守我們的服務條款使用政策,這些條款禁止 Claude 的某些使用方式。未能遵守條款使用政策可能導致您的服務訪問權限被暫停或終止。

基本保障措施

  • 存儲與每個 API 調用相關聯的 ID,以便在需要查找特定違規內容時,您能夠在系統中找到它。

  • 考慮為用戶分配 ID,這可以幫助您追蹤違反 Anthropic AUP 的特定個人,允許在濫用情況下採取更有針對性的行動。

    • 是否通過 API 將 ID 傳遞給 Anthropic 由您決定。但是,如果提供了 ID,我們可以更精確地查明違規行為。為了幫助保護最終用戶的隱私,傳遞的任何 ID 應進行密碼學哈希處理。

  • 考慮要求客戶在使用 Claude 之前在您的平台上註冊帳戶

  • 確保您的客戶了解允許的使用方式

  • 對於重複違反 Anthropic 服務條款使用政策的用戶,進行警告、限流或暫停

中級保障措施

  • 創建自定義框架,將最終用戶與 Claude 的交互限制在有限的提示集合中,或僅允許 Claude 審查您已有的特定知識庫,這將降低用戶從事違規行為的能力。

  • 啟用額外的安全過濾器 - 由 Anthropic 構建的免費實時審核工具,用於幫助檢測可能有害的提示並管理實時操作以減少傷害

    • 有關如何啟用我們的額外安全過濾器的更多信息,請聯繫[email protected]

  • 針對 Bedrock 客戶:

    • 激活您的私有 S3 存儲桶,以便存儲提示和完成結果供您自己評估

高級保障措施

綜合保障措施

  • 設置內部人工審查系統,以標記由 Claude(用於內容審核)或審核 API 標記為有害的提示,以便您可以進行干預,限制或移除違規率高的用戶。

是否回答了您的問題?