Zum Hauptinhalt springen

Verständnis der API-Sicherheitsfilter von Sonnet 4.5

Diese Woche aktualisiert

Claude Sonnet 4.5 umfasst neue Schutzmaßnahmen der AI Safety Level 3 (ASL-3), die entwickelt wurden, um Missbrauch im Zusammenhang mit chemischen, biologischen, radiologischen und nuklearen (CBRN) Waffen zu verhindern. Diese Sicherheitsmaßnahmen nutzen Constitutional Classifiers, die Ein- und Ausgaben überwachen, um eine enge Kategorie schädlicher Inhalte zu blockieren.

Warum wurde meine API-Anfrage blockiert?

Die Sicherheitsfilter von Sonnet 4.5 sind eng auf die Verhinderung von Unterstützung bei CBRN-waffenbezogenen Aufgaben ausgerichtet. Wenn Ihre Anfrage blockiert wurde, haben die Filter Inhalte erkannt, die Mustern entsprechen, die mit diesen spezifischen Bedrohungen verbunden sind.

Diese Filter werden noch verfeinert. Wie bei jedem automatisierten System können Fehlalarme auftreten – das heißt, legitime Anfragen können gelegentlich fälschlicherweise gekennzeichnet werden. Wir arbeiten aktiv daran, die Genauigkeit dieser Klassifizierer zu verbessern, um Störungen zu minimieren und gleichzeitig die Sicherheit zu gewährleisten.

Was Sie tun können

Wenn Ihre API-Anfrage blockiert wird, können Sie folgende Schritte unternehmen:

Vermeiden Sie Muster, die Fehlalarme auslösen

Die Klassifizierer reagieren empfindlich auf bestimmte Muster, die Jailbreak-Versuchen oder Verschleierungstechniken ähneln können:

  • Vermeiden Sie chiffreähnliche Inhalte: Base64-codierte Zeichenketten, Git-Commit-Hashes, Hexadezimalsequenzen und andere codierte Daten können die Filter auslösen. Wenn Sie solche Inhalte einbeziehen müssen, überlegen Sie, ob sie für Ihren Anwendungsfall erforderlich sind.

  • Vereinfachen Sie Systeminstruktionen: Übermäßig lange oder komplexe Systemaufforderungen, die komplizierte bedingte Logik enthalten, können wie Versuche wirken, das Verhalten zu verschleiern. Halten Sie Systeminstruktionen klar und unkompliziert.

  • Seien Sie vorsichtig mit biologiebezogenen Inhalten: Wenn Ihre Anwendung nicht speziell biologische oder chemische Informationen erfordert, erwägen Sie, Anfragen umzuformulieren, um diese Themen wenn möglich zu vermeiden.

Wechseln Sie zu Sonnet 4

Verwenden Sie Sonnet 4 statt Sonnet 4.5 in Ihren API-Aufrufen. Sonnet 4 nutzt andere Sicherheitsmaßnahmen und kann Ihre Anfrage möglicherweise erfolgreich verarbeiten.

Implementieren Sie Fallback-Logik

Integrieren Sie Fehlerbehandlung in Ihre Anwendung, die folgende Funktionen bietet:

  • Erkennen Sie, wenn eine Anfrage durch Sicherheitsfilter blockiert wird.

  • Versuchen Sie automatisch erneut mit Sonnet 4 als Fallback.

  • Protokollieren Sie Vorfälle zur Überprüfung, um Muster in Fehlalarmen zu identifizieren.

Geben Sie Feedback

Wenn Sie der Meinung sind, dass Ihre Anfrage fälschlicherweise blockiert wurde, kontaktieren Sie unser API-Support-Team. Ihr Feedback hilft uns, die Filtergenauigkeit zu verbessern und Fehlalarme für legitime Anwendungsfälle zu reduzieren.

Warum die neuen Filter?

Mit zunehmender Leistungsfähigkeit von KI-Modellen sind stärkere Schutzmaßnahmen gegen möglichen Missbrauch erforderlich. Die ASL-3-Bereitstellungsmaßnahmen von Sonnet 4.5 sind Teil von Anthropics Responsible Scaling Policy, die sicherstellt, dass zunehmend leistungsfähigere Modelle über angemessene Schutzvorrichtungen verfügen.

Die Filter sind speziell darauf ausgelegt, erweiterte, durchgehende CBRN-Workflows zu verhindern, die katastrophale Risiken darstellen könnten. Sie sind nicht dazu bestimmt, allgemeine wissenschaftliche Diskussionen, Bildungsinhalte oder allgemein verfügbare Informationen zu blockieren.

Für Forscher und Dual-Use-Anwendungen

Wenn Sie Anwendungen für wissenschaftliche Forschung oder Dual-Use-Technologiebereiche entwickeln und Zugriff für legitime Zwecke benötigen, haben wir Zugriffskontrollsysteme für überprüfte Benutzer eingerichtet. Kontaktieren Sie unser API-Support-Team, um mehr über Ausnahmen zu erfahren.

Hat dies deine Frage beantwortet?