Claude Sonnet 4.5 beinhaltet AI Safety Level 3 (ASL-3) Schutzmaßnahmen, die entwickelt wurden, um Missbrauch im Zusammenhang mit chemischen, biologischen, radiologischen und nuklearen (CBRN) Waffen zu verhindern. Diese Sicherheitsmaßnahmen umfassen Filter, sogenannte Klassifizierer, die potenziell gefährliche Ein- und Ausgaben erkennen.

Warum wurde meine Nachricht blockiert?

Die Sicherheitsfilter von Sonnet 4.5 sollen Unterstützung bei CBRN-bezogenen (chemischen, biologischen, radiologischen und nuklearen) Waffenaufgaben verhindern. Wenn Sie eine Fehlermeldung erhalten haben, haben die Filter Inhalte erkannt, die Mustern entsprechen, die mit diesen spezifischen Bedrohungen verbunden sind.

Diese Filter werden noch verfeinert und können manchmal versehentlich normale Inhalte kennzeichnen. Wie bei jedem automatisierten System können Fehlalarme auftreten – das heißt, legitime Anfragen können gelegentlich fälschlicherweise gekennzeichnet werden. Wir arbeiten aktiv daran, die Genauigkeit dieser Klassifizierer zu verbessern, um Störungen zu minimieren und gleichzeitig die Sicherheit zu gewährleisten.

Was Sie tun können

Wenn Sie glauben, dass Ihre Nachricht als Reaktion auf eine legitime Verwendung blockiert wird, haben Sie mehrere Optionen:

Vermeiden Sie Muster, die Fehlalarme auslösen

Die Klassifizierer reagieren empfindlich auf bestimmte Muster, die Jailbreak-Versuchen oder Verschleierungstechniken ähneln können:

Vermeiden Sie chiffreähnliche Inhalte: Base64-codierte Zeichenfolgen, Git-Commit-Hashes, Hexadezimalsequenzen und andere codierte Daten können die Filter auslösen. Wenn Sie solche Inhalte einbeziehen müssen, fügen Sie umgebende Inhalte hinzu, um zu erklären, wie und warum sie verwendet werden.

Vereinfachen Sie Anweisungen: Übermäßig lange oder komplexe System-Prompts, die komplizierte bedingte Logik enthalten, können wie Versuche wirken, das Verhalten zu verschleiern. Halten Sie Prompts klar und unkompliziert.

Seien Sie vorsichtig mit biologiebezogenen Inhalten: Wenn Ihre Anwendung keine biologischen oder chemischen Informationen speziell erfordert, erwägen Sie, Anfragen umzuformulieren, um diese Themen wenn möglich zu vermeiden.

Weitere Optionen

Fortfahren mit Claude Sonnet 4: Sie können für den Rest des Gesprächs zu Claude Sonnet 4 wechseln, das andere Sicherheitsmaßnahmen verwendet und möglicherweise bei Ihrer Anfrage helfen kann.

Feedback senden: Sie können uns Ihr Feedback mitteilen, das uns hilft, die Filtergenauigkeit zu verbessern.

Bearbeiten Sie Ihre Nachricht: Sie können versuchen, Ihre Frage umzuformulieren oder zusätzlichen Kontext über Ihren legitimen Anwendungsfall bereitzustellen.

Warum die Filter?

Da KI-Modelle immer leistungsfähiger werden, benötigen sie stärkere Schutzmaßnahmen gegen möglichen Missbrauch. Die ASL-3-Bereitstellungsmaßnahmen von Sonnet 4.5 sind Teil von Anthropics Responsible Scaling Policy, die sicherstellt, dass zunehmend leistungsfähigere Modelle über angemessene Schutzvorrichtungen verfügen.

Die Filter sind speziell dazu konzipiert, erweiterte, durchgehende CBRN-Workflows zu verhindern, die katastrophale Risiken darstellen könnten. Sie sind nicht dazu bestimmt, allgemeine wissenschaftliche Diskussionen, Bildungsinhalte oder allgemein verfügbare Informationen zu blockieren.

Für Forscher und Dual-Use-Anwendungen

Wenn Sie in der wissenschaftlichen Forschung tätig sind und Zugang für legitime Zwecke benötigen, haben wir Zugriffskontrollsysteme für überprüfte Benutzer eingerichtet. Kontaktieren Sie unser Support-Team, um mehr zu erfahren.

Verwandte Artikel

Meldung, Blockierung und Entfernung von Inhalten aus Claude

Websuche aktivieren und verwenden