無論您是剛開始為 Claude 的 API 部署設置保障措施,還是您的部署已經在運行,以下是在構建自己的 AI 安全計劃時應考慮的一些策略。這些建議旨在幫助您遵守我們的服務條款和使用政策,這些條款禁止 Claude 的某些使用方式。未能遵守條款和使用政策可能導致您的服務訪問權限被暫停或終止。
基本保障措施
存儲與每個 API 調用相關聯的 ID,以便在需要查找特定違規內容時,您能夠在系統中找到它。
考慮為用戶分配 ID,這可以幫助您追蹤違反 Anthropic AUP 的特定個人,允許在濫用情況下採取更有針對性的行動。
是否通過 API 將 ID 傳遞給 Anthropic 由您決定。但是,如果提供了 ID,我們可以更精確地查明違規行為。為了幫助保護最終用戶的隱私,傳遞的任何 ID 應進行密碼學哈希處理。
考慮要求客戶在使用 Claude 之前在您的平台上註冊帳戶
確保您的客戶了解允許的使用方式
中級保障措施
創建自定義框架,將最終用戶與 Claude 的交互限制在有限的提示集合中,或僅允許 Claude 審查您已有的特定知識庫,這將降低用戶從事違規行為的能力。
啟用額外的安全過濾器 - 由 Anthropic 構建的免費實時審核工具,用於幫助檢測可能有害的提示並管理實時操作以減少傷害
有關如何啟用我們的額外安全過濾器的更多信息,請聯繫[email protected]。
針對 Bedrock 客戶:
激活您的私有 S3 存儲桶,以便存儲提示和完成結果供您自己評估
高級保障措施
在將所有最終用戶提示發送給 Claude 之前,對其運行審核 API,以確保它們不是有害的
綜合保障措施
設置內部人工審查系統,以標記由 Claude(用於內容審核)或審核 API 標記為有害的提示,以便您可以進行干預,限制或移除違規率高的用戶。
