Claude Sonnet 4.5 umfasst AI Safety Level 3 (ASL-3) Schutzmaßnahmen, die entwickelt wurden, um Missbrauch im Zusammenhang mit chemischen, biologischen, radiologischen und nuklearen (CBRN) Waffen zu verhindern. Diese Sicherheitsmaßnahmen umfassen Filter, sogenannte Klassifizierer, die potenziell gefährliche Ein- und Ausgaben erkennen.
Warum wurde meine Nachricht blockiert?
Die Sicherheitsfilter von Sonnet 4.5 sollen verhindern, dass bei CBRN-bezogenen (chemischen, biologischen, radiologischen und nuklearen) Waffenaufgaben Unterstützung geleistet wird. Wenn Sie eine Fehlermeldung erhalten haben, haben die Filter Inhalte erkannt, die Mustern entsprechen, die mit diesen spezifischen Bedrohungen verbunden sind.
Diese Filter werden noch verfeinert und können manchmal versehentlich normale Inhalte kennzeichnen. Wie bei jedem automatisierten System können Fehlalarme auftreten – das heißt, legitime Anfragen können gelegentlich fälschlicherweise gekennzeichnet werden. Wir arbeiten aktiv daran, die Genauigkeit dieser Klassifizierer zu verbessern, um Störungen zu minimieren und gleichzeitig die Sicherheit zu gewährleisten.
Was Sie tun können
Wenn Sie glauben, dass Ihre Nachricht aufgrund einer legitimen Verwendung blockiert wird, haben Sie mehrere Optionen:
Vermeiden Sie Muster, die Fehlalarme auslösen
Die Klassifizierer reagieren empfindlich auf bestimmte Muster, die Jailbreak-Versuchen oder Verschleierungstechniken ähneln:
Vermeiden Sie chiffreähnliche Inhalte: Base64-codierte Zeichenfolgen, Git-Commit-Hashes, Hexadezimalsequenzen und andere codierte Daten können die Filter auslösen. Wenn Sie solche Inhalte einbeziehen müssen, fügen Sie umgebende Inhalte hinzu, um zu erklären, wie und warum sie verwendet werden.
Vereinfachen Sie Anweisungen: Übermäßig lange oder komplexe System-Prompts, die komplexe bedingte Logik enthalten, können wie Versuche wirken, das Verhalten zu verschleiern. Halten Sie Prompts klar und unkompliziert.
Seien Sie vorsichtig mit biologiebezogenen Inhalten: Wenn Ihre Anwendung keine biologischen oder chemischen Informationen erfordert, erwägen Sie, Anfragen umzuformulieren, um diese Themen wenn möglich zu vermeiden.
Weitere Optionen
Fahren Sie mit Claude Sonnet 4 fort: Sie können für den Rest des Gesprächs zu Claude Sonnet 4 wechseln, das andere Sicherheitsmaßnahmen verwendet und möglicherweise bei Ihrer Anfrage helfen kann.
Geben Sie Feedback: Sie können uns Ihr Feedback mitteilen, das uns hilft, die Filtergenauigkeit zu verbessern.
Bearbeiten Sie Ihre Nachricht: Sie können versuchen, Ihre Frage umzuformulieren oder zusätzlichen Kontext über Ihren legitimen Anwendungsfall bereitzustellen.
Warum die Filter?
Da KI-Modelle immer leistungsfähiger werden, benötigen sie stärkere Schutzmaßnahmen gegen möglichen Missbrauch. Die ASL-3-Bereitstellungsmaßnahmen von Sonnet 4.5 sind Teil von Anthropics Responsible Scaling Policy, die sicherstellt, dass zunehmend leistungsfähigere Modelle über angemessene Schutzvorrichtungen verfügen.
Die Filter sind speziell dazu konzipiert, erweiterte, durchgehende CBRN-Workflows zu verhindern, die katastrophale Risiken darstellen könnten. Sie sind nicht dazu bestimmt, allgemeine wissenschaftliche Diskussionen, Bildungsinhalte oder allgemein verfügbare Informationen zu blockieren.
Für Forscher und Dual-Use-Anwendungen
Wenn Sie in der wissenschaftlichen Forschung tätig sind und Zugang für legitime Zwecke benötigen, haben wir Zugriffskontrollsysteme für überprüfte Benutzer eingerichtet. Kontaktieren Sie unser Support-Team, um mehr zu erfahren.