Claude Sonnet 4.5 include protezioni AI Safety Level 3 (ASL-3) progettate per prevenire l'uso improprio relativo alle armi chimiche, biologiche, radiologiche e nucleari (CBRN). Queste misure di sicurezza includono filtri chiamati classificatori che rilevano input e output potenzialmente pericolosi.
Perché il mio messaggio è stato bloccato?
I filtri di sicurezza di Sonnet 4.5 sono destinati a prevenire l'assistenza con attività correlate alle armi CBRN (Chimiche, Biologiche, Radiologiche e Nucleari). Se hai ricevuto un messaggio di errore, i filtri hanno rilevato contenuti che corrispondevano a pattern associati a queste minacce specifiche.
Questi filtri sono ancora in fase di perfezionamento e potrebbero occasionalmente contrassegnare erroneamente contenuti normali. Come con qualsiasi sistema automatizzato, possono verificarsi falsi positivi, il che significa che le query legittime potrebbero occasionalmente essere contrassegnate in modo errato. Stiamo lavorando attivamente per migliorare la precisione di questi classificatori al fine di ridurre al minimo i disagi mantenendo la sicurezza.
Cosa puoi fare
Se ritieni che il tuo messaggio sia bloccato in risposta a un uso legittimo, hai diverse opzioni:
Evita pattern che attivano falsi positivi
I classificatori sono sensibili a determinati pattern che potrebbero assomigliare a tentativi di jailbreak o tecniche di offuscamento:
Evita contenuti simili a cifre: stringhe codificate in Base64, hash di commit git, sequenze esadecimali e altri dati codificati possono attivare i filtri. Se hai bisogno di includere tale contenuto, includi il contenuto circostante per spiegare come e perché viene utilizzato.
Semplifica le istruzioni: i prompt di sistema eccessivamente lunghi o complessi che includono logica condizionale intricata potrebbero assomigliare a tentativi di offuscare il comportamento. Mantieni i prompt chiari e diretti.
Sii cauto con contenuti correlati alla biologia: se la tua applicazione non richiede specificamente informazioni biologiche o chimiche, considera di riformulare le richieste per evitare questi argomenti quando possibile.
Altre opzioni
Continua con Claude Sonnet 4: puoi passare a Claude Sonnet 4 per il resto della conversazione, che utilizza misure di sicurezza diverse e potrebbe essere in grado di aiutarti con la tua richiesta.
Invia feedback: puoi farci sapere poiché il tuo feedback ci aiuta a migliorare l'accuratezza dei filtri.
Modifica il tuo messaggio: puoi provare a riformulare la tua domanda o fornire contesto aggiuntivo sul tuo caso d'uso legittimo.
Perché i filtri?
Man mano che i modelli di IA diventano più capaci, richiedono protezioni più forti contro il potenziale uso improprio. Le misure di distribuzione ASL-3 di Sonnet 4.5 fanno parte della Responsible Scaling Policy di Anthropic, che garantisce che i modelli sempre più capaci abbiano salvaguardie appropriate.
I filtri sono specificamente progettati per prevenire flussi di lavoro CBRN estesi e end-to-end che potrebbero comportare rischi catastrofici. Non sono destinati a bloccare discussioni scientifiche generali, contenuti educativi o informazioni comunemente disponibili.
Per ricercatori e applicazioni a doppio uso
Se stai lavorando nella ricerca scientifica e hai bisogno di accesso per scopi legittimi, abbiamo stabilito sistemi di controllo dell'accesso per utenti verificati. Contatta il nostro team di supporto per saperne di più.