无论您是刚开始为Claude的API部署设置保护措施,还是您的部署已经在运行,以下是在构建自己的AI安全计划时应考虑的一些策略。这些建议旨在帮助您遵守我们的服务条款和使用政策,这些条款和政策禁止Claude的某些使用方式。未能遵守服务条款和使用政策可能导致您的服务访问权限被暂停或终止。
基础保护措施
存储与每个API调用相关联的ID,以便在需要查找特定违规内容时,您能够在系统中找到它。
考虑为用户分配ID,这可以帮助您追踪违反Anthropic AUP的特定个人,允许在滥用情况下采取更有针对性的行动。
通过API将ID传递给Anthropic的选择由您决定。但是,如果提供了ID,我们可以更精确地查明违规行为。为了帮助保护最终用户的隐私,传递的任何ID都应该进行密码学哈希处理。
考虑要求客户在使用Claude之前在您的平台上注册账户
确保您的客户了解允许的使用方式
中级保护措施
创建自定义框架,将最终用户与Claude的交互限制在有限的提示集合中,或仅允许Claude审查您已有的特定知识库,这将降低用户从事违规行为的能力。
启用额外的安全过滤器 - 由Anthropic构建的免费实时审核工具,用于帮助检测可能有害的提示并管理实时操作以减少伤害
有关如何启用我们的额外安全过滤器的更多信息,请联系[email protected]。
对于Bedrock客户:
激活您的私有S3存储桶,以便存储提示和完成结果供您自己评估
高级保护措施
在所有最终用户提示发送到Claude之前,对其运行审核API,以确保它们不是有害的
综合保护措施
建立内部人工审查系统,标记由Claude(用于内容审核)或审核API标记为有害的提示,以便您可以进行干预,限制或删除违规率高的用户。
