跳转到主要内容

理解 Sonnet 4.5 的安全过滤器

本周更新

Claude Sonnet 4.5 包含人工智能安全等级 3 (ASL-3) 保护措施,旨在防止与化学、生物、放射性和核 (CBRN) 武器相关的滥用。这些安全措施包括称为分类器的过滤器,可检测潜在危险的输入和输出。

为什么我的消息被阻止了?

Sonnet 4.5 的安全过滤器旨在防止协助与 CBRN(化学、生物、放射性和核)武器相关的任务。如果您收到错误消息,说明过滤器检测到与这些特定威胁相关的内容。

这些过滤器仍在不断完善,有时可能会无意中标记正常内容。与任何自动化系统一样,误报可能会发生——这意味着合法查询有时可能会被错误地标记。我们正在积极改进这些分类器的精度,以最大限度地减少干扰,同时保持安全。

您可以做什么

如果您认为您的消息因合法使用而被阻止,您有几个选择:

避免触发误报的模式

分类器对某些可能类似于越狱尝试或混淆技术的模式很敏感:

  • 避免类似密码的内容:Base64 编码的字符串、git 提交哈希、十六进制序列和其他编码数据可能会触发过滤器。如果您需要包含此类内容,请包含周围的内容来解释它是如何以及为什么被使用的。

  • 简化指令:过长或复杂的系统提示,包含复杂的条件逻辑,可能类似于混淆行为的尝试。保持提示清晰明了

  • 谨慎处理与生物学相关的内容:如果您的应用程序不特别需要生物或化学信息,请考虑重新表述请求,以尽可能避免这些主题。

其他选择

  • 继续使用 Claude Sonnet 4:您可以在对话的其余部分切换到 Claude Sonnet 4,它使用不同的安全措施,可能能够帮助您的请求。

  • 发送反馈:您可以让我们了解您的反馈,这有助于我们改进过滤器的准确性。

  • 编辑您的消息:您可以尝试重新表述您的问题或提供有关您合法使用案例的其他背景信息。

为什么要使用这些过滤器?

随着人工智能模型变得越来越强大,它们需要更强的保护措施来防止潜在的滥用。Sonnet 4.5 的 ASL-3 部署措施是 Anthropic 负责任扩展政策的一部分,该政策确保日益强大的模型具有适当的保护措施。

这些过滤器专门设计用于防止可能造成灾难性风险的扩展的端到端 CBRN 工作流。它们旨在阻止一般科学讨论、教育内容或常见信息。

对于研究人员和双用途应用

如果您从事科学研究工作,需要出于合法目的进行访问,我们已为经过审查的用户建立了访问控制系统。请联系我们的支持团队了解更多信息。

这是否解答了您的问题?