跳转到主要内容

理解 Sonnet 4.5 的 API 安全过滤器

本周更新

Claude Sonnet 4.5 包含新的 AI 安全等级 3 (ASL-3) 保护措施,旨在防止与化学、生物、放射性和核 (CBRN) 武器相关的滥用。这些安全措施使用宪法分类器来监控输入和输出,以阻止一类狭义的有害内容。

为什么我的 API 请求被阻止了?

Sonnet 4.5 的安全过滤器专注于防止协助完成与 CBRN 武器相关的任务。如果您的请求被阻止,说明过滤器检测到了与这些特定威胁相关的内容模式。

这些过滤器仍在不断完善中。与任何自动化系统一样,误报可能会发生——这意味着合法请求有时可能会被错误地标记。我们正在积极改进这些分类器的精度,以最大限度地减少干扰,同时保持安全性。

您可以采取的措施

如果您的 API 请求被阻止,以下是您可以采取的步骤:

避免触发误报的模式

分类器对某些可能类似于越狱尝试或混淆技术的模式很敏感:

  • 避免类似密码的内容:Base64 编码字符串、git 提交哈希、十六进制序列和其他编码数据可能会触发过滤器。如果您需要包含此类内容,请考虑它是否对您的用例至关重要。

  • 简化系统指令:过长或复杂的系统提示,包含复杂的条件逻辑,可能类似于混淆行为的尝试。保持系统指令清晰明了。

  • 谨慎处理生物相关内容:如果您的应用程序不特别需要生物或化学信息,请考虑重新表述请求,尽可能避免这些主题。

切换到 Sonnet 4

在您的 API 调用中使用 Sonnet 4 而不是 Sonnet 4.5。Sonnet 4 使用不同的安全措施,可能能够成功处理您的请求。

实现回退逻辑

在您的应用程序中构建错误处理,可以:

  • 检测请求何时被安全过滤器阻止。

  • 自动重试,以 Sonnet 4 作为回退方案。

  • 记录事件供您审查,以识别误报中的模式。

提供反馈

如果您认为您的请求被错误地阻止,请联系我们的 API 支持团队。您的反馈帮助我们提高过滤器的准确性,并为合法用例减少误报。

为什么要使用新的过滤器?

随着 AI 模型变得越来越强大,它们需要更强的保护措施来防止潜在的滥用。Sonnet 4.5 的 ASL-3 部署措施是 Anthropic 负责任扩展政策的一部分,该政策确保日益强大的模型具有适当的保护措施。

这些过滤器专门设计用于防止可能造成灾难性风险的扩展的端到端 CBRN 工作流。它们旨在阻止一般科学讨论、教育内容或常见信息。

对于研究人员和双用途应用

如果您正在为科学研究或双用途技术领域构建应用程序,并需要出于合法目的进行访问,我们已为经过审查的用户建立了访问控制系统。请联系我们的 API 支持团队,了解有关豁免的更多信息。

这是否解答了您的问题?