Claude Sonnet 4.5 inclut des protections de niveau de sécurité IA 3 (ASL-3) conçues pour prévenir les abus liés aux armes chimiques, biologiques, radiologiques et nucléaires (CBRN). Ces mesures de sécurité incluent des filtres appelés classificateurs qui détectent les entrées et sorties potentiellement dangereuses.
Pourquoi mon message a-t-il été bloqué ?
Les filtres de sécurité de Sonnet 4.5 sont destinés à prévenir l'assistance pour les tâches liées aux armes CBRN (chimiques, biologiques, radiologiques et nucléaires). Si vous avez reçu un message d'erreur, les filtres ont détecté du contenu correspondant à des modèles associés à ces menaces spécifiques.
Ces filtres sont toujours en cours de perfectionnement et ils peuvent parfois signaler involontairement du contenu normal. Comme tout système automatisé, des faux positifs peuvent se produire, ce qui signifie que des requêtes légitimes peuvent occasionnellement être signalées incorrectement. Nous travaillons activement à l'amélioration de la précision de ces classificateurs pour minimiser les perturbations tout en maintenant la sécurité.
Ce que vous pouvez faire
Si vous pensez que votre message est bloqué en réponse à une utilisation légitime, vous avez plusieurs options :
Évitez les modèles qui déclenchent des faux positifs
Les classificateurs sont sensibles à certains modèles qui peuvent ressembler à des tentatives de contournement de sécurité ou à des techniques d'obfuscation :
Évitez le contenu de type chiffré : Les chaînes encodées en Base64, les hachages de commits git, les séquences hexadécimales et autres données encodées peuvent déclencher les filtres. Si vous devez inclure ce type de contenu, incluez le contenu qui l'entoure pour expliquer comment et pourquoi il est utilisé.
Simplifiez les instructions : Les invites système excessivement longues ou complexes qui incluent une logique conditionnelle complexe peuvent ressembler à des tentatives d'obfuscation du comportement. Gardez les invites claires et directes.
Soyez prudent avec le contenu lié à la biologie : Si votre application ne nécessite pas spécifiquement d'informations biologiques ou chimiques, envisagez de reformuler les requêtes pour éviter ces sujets si possible.
Autres options
Continuez avec Claude Sonnet 4 : Vous pouvez passer à Claude Sonnet 4 pour le reste de la conversation, qui utilise des mesures de sécurité différentes et peut être en mesure de vous aider avec votre requête.
Envoyez vos commentaires : Vous pouvez nous faire savoir car vos commentaires nous aident à améliorer la précision des filtres.
Modifiez votre message : Vous pouvez essayer de reformuler votre question ou de fournir un contexte supplémentaire sur votre cas d'utilisation légitime.
Pourquoi les filtres ?
À mesure que les modèles d'IA deviennent plus puissants, ils nécessitent des protections plus fortes contre les abus potentiels. Les mesures de déploiement ASL-3 de Sonnet 4.5 font partie de la politique de mise à l'échelle responsable d'Anthropic, qui garantit que les modèles de plus en plus puissants disposent de protections appropriées.
Les filtres sont spécifiquement conçus pour prévenir les flux de travail CBRN prolongés et de bout en bout qui pourraient poser des risques catastrophiques. Ils ne sont pas destinés à bloquer les discussions scientifiques générales, le contenu éducatif ou les informations couramment disponibles.
Pour les chercheurs et les applications à double usage
Si vous travaillez dans la recherche scientifique et avez besoin d'accès à des fins légitimes, nous avons établi des systèmes de contrôle d'accès pour les utilisateurs vérifiés. Contactez notre équipe d'assistance pour en savoir plus.