Anthropic

Claude Sonnet 4.5 include protezioni <a href="https://www.anthropic.com/news/activating-asl3-protections" rel="nofollow noopener noreferrer" target="_blank">AI Safety Level 3 (ASL-3)</a> progettate per prevenire l'uso improprio relativo alle armi chimiche, biologiche, radiologiche e nucleari (CBRN). Queste misure di sicurezza includono filtri chiamati classificatori che rilevano input e output potenzialmente pericolosi.

Perché il mio messaggio è stato bloccato?

I filtri di sicurezza di Sonnet 4.5 sono destinati a prevenire l'assistenza con attività correlate alle armi CBRN (Chimiche, Biologiche, Radiologiche e Nucleari). Se hai ricevuto un messaggio di errore, i filtri hanno rilevato contenuti che corrispondevano a modelli associati a queste minacce specifiche.

Questi filtri sono ancora in fase di perfezionamento e potrebbero occasionalmente contrassegnare erroneamente contenuti normali. Come con qualsiasi sistema automatizzato, possono verificarsi falsi positivi, il che significa che le query legittime potrebbero occasionalmente essere contrassegnate in modo errato. Stiamo lavorando attivamente per migliorare la precisione di questi classificatori al fine di ridurre al minimo i disagi mantenendo la sicurezza.

Se ritieni che il tuo messaggio sia bloccato in risposta a un uso legittimo, hai diverse opzioni:

Evita i modelli che attivano falsi positivi

I classificatori sono sensibili a determinati modelli che potrebbero assomigliare a tentativi di jailbreak o tecniche di offuscamento:

Evita contenuti simili a cifre: stringhe codificate in Base64, hash di commit git, sequenze esadecimali e altri dati codificati possono attivare i filtri. Se hai bisogno di includere tale contenuto, includi il contenuto circostante per spiegare come e perché viene utilizzato.

- Evita contenuti simili a cifre: stringhe codificate in Base64, hash di commit git, sequenze esadecimali e altri dati codificati possono attivare i filtri. Se hai bisogno di includere tale contenuto, includi il contenuto circostante per spiegare come e perché viene utilizzato.

Semplifica le istruzioni: i prompt di sistema eccessivamente lunghi o complessi che includono logica condizionale intricata potrebbero assomigliare a tentativi di offuscare il comportamento. Mantieni i prompt <a href="https://docs.claude.com/en/docs/build-with-claude/prompt-engineering/overview" rel="nofollow noopener noreferrer" target="_blank">chiari e diretti</a>.

- Semplifica le istruzioni: i prompt di sistema eccessivamente lunghi o complessi che includono logica condizionale intricata potrebbero assomigliare a tentativi di offuscare il comportamento. Mantieni i prompt <a href="https://docs.claude.com/en/docs/build-with-claude/prompt-engineering/overview" rel="nofollow noopener noreferrer" target="_blank">chiari e diretti</a>.

Sii cauto con i contenuti correlati alla biologia: se la tua applicazione non richiede specificamente informazioni biologiche o chimiche, considera di riformulare le richieste per evitare questi argomenti quando possibile.

- Sii cauto con i contenuti correlati alla biologia: se la tua applicazione non richiede specificamente informazioni biologiche o chimiche, considera di riformulare le richieste per evitare questi argomenti quando possibile.

Continua con Claude Sonnet 4: puoi passare a Claude Sonnet 4 per il resto della conversazione, che utilizza misure di sicurezza diverse e potrebbe essere in grado di aiutarti con la tua richiesta.

- Continua con Claude Sonnet 4: puoi passare a Claude Sonnet 4 per il resto della conversazione, che utilizza misure di sicurezza diverse e potrebbe essere in grado di aiutarti con la tua richiesta.

Invia feedback: puoi farci sapere poiché il tuo feedback ci aiuta a migliorare l'accuratezza dei filtri.

- Invia feedback: puoi farci sapere poiché il tuo feedback ci aiuta a migliorare l'accuratezza dei filtri.

Modifica il tuo messaggio: puoi provare a riformulare la tua domanda o fornire ulteriore contesto sul tuo caso d'uso legittimo.

- Modifica il tuo messaggio: puoi provare a riformulare la tua domanda o fornire ulteriore contesto sul tuo caso d'uso legittimo.

Man mano che i modelli di IA diventano più capaci, richiedono protezioni più forti contro il potenziale uso improprio. Le misure di distribuzione ASL-3 di Sonnet 4.5 fanno parte della <a href="https://www.anthropic.com/news/activating-asl3-protections" rel="nofollow noopener noreferrer" target="_blank">Responsible Scaling Policy</a> di Anthropic, che garantisce che i modelli sempre più capaci abbiano salvaguardie appropriate.

I filtri sono specificamente progettati per prevenire flussi di lavoro CBRN estesi e end-to-end che potrebbero comportare rischi catastrofici. Non sono destinati a bloccare discussioni scientifiche generali, contenuti educativi o informazioni comunemente disponibili.

Per ricercatori e applicazioni a doppio uso

Se stai lavorando nella ricerca scientifica e hai bisogno di accesso per scopi legittimi, abbiamo stabilito sistemi di controllo dell'accesso per utenti verificati. Contatta il nostro <a href="https://support.claude.com">team di supporto</a> per saperne di più.

Comprensione dei Filtri di Sicurezza di Sonnet 4.5

Terms of Service - Consumer

Product

Research

Terms of Service - Commercial

Privacy Policy

Company

Usage Policy

News

Responsible Disclosure Policy

Careers

Compliance

Trova le risposte e ottieni aiuto dall'assistenza Intercom e dagli esperti della community

Le conversazioni che hai iniziato tramite il messenger appariranno qui.

Nessuna conversazione creata da te

Prova a utilizzare parole chiave diverse o a verificare la presenza di errori di battitura.

Prova a usare parole chiave o filtri diversi.

Nessuna conversazione trovata

Titolo

Questo sito utilizza cookie e altre tecnologie che noi e i nostri fornitori di terze parti utilizziamo per monitorare e registrare le informazioni personali sugli utenti e sulle interazioni degli utenti con il sito (inclusi i contenuti visualizzati, i movimenti del cursore, le registrazioni dello schermo e i contenuti delle chat) per gli scopi descritti nella nostra Informativa sui cookie. Continuando a visitare il nostro sito, l'utente accetta i nostri {websiteTermsLink}, {privacyPolicyLink} e {cookiePolicyLink}.

Questo sito utilizza cookie e tecnologie simili ("cookie") nella misura strettamente necessaria per il funzionamento del sito. Insieme ai nostri partner, desideriamo inoltre impostare ulteriori cookie per consentire l'analisi delle prestazioni del sito, la funzionalità, la pubblicità e le funzionalità dei social media. Per maggiori dettagli, consulta la nostra {cookiePolicyLink}. Puoi modificare le tue preferenze sui cookie nelle nostre Impostazioni dei cookie.

Utilizziamo i cookie per far funzionare il nostro sito e anche per scopi di analisi e pubblicità. È possibile abilitare o disabilitare i cookie opzionali secondo le proprie preferenze. Per maggiori dettagli, consultare la nostra {cookiePolicyLink}.

I cookie pubblicitari sono impostati dai nostri partner pubblicitari per raccogliere informazioni sull'uso del sito, delle nostre comunicazioni e di altri servizi online nel tempo e con browser e dispositivi diversi. Usano queste informazioni per mostrarle annunci online che ritengono possano interessare gli utenti e misurare le prestazioni degli annunci. I cookie dei social media sono impostati dalle piattaforme di social media per consentire agli utenti di condividere contenuti su tali piattaforme e sono in grado di tracciare le informazioni sull'attività dell'utente su altri servizi online per utilizzarle come descritto nelle loro politiche sulla privacy.

Questi cookie consentono al sito web di fornire funzionalità avanzate e personalizzazione. Possono essere impostati da noi o da fornitori di terze parti i cui servizi abbiamo aggiunto alle nostre pagine. Se non si acconsente all'utilizzo di questi cookie, alcuni o tutti questi servizi potrebbero non funzionare correttamente.

Questi cookie sono necessari per il funzionamento del sito web e non possono essere disattivati nei nostri sistemi.

Questi cookie ci consentono di contare le visite e le fonti di traffico in modo da poter misurare e migliorare le prestazioni del nostro sito. Ci aiutano a sapere quali sono le pagine più e meno popolari e a vedere come i visitatori si muovono all'interno del sito.

Hai il diritto di opporti alla vendita delle tue informazioni personali. Consulta la nostra {cookiePolicyLink} per maggiori dettagli su come utilizziamo i tuoi dati.

Le tue scelte sulla privacy

Utilizziamo i cookie per migliorare la tua esperienza. Puoi personalizzare le tue preferenze sui cookie di seguito. Per maggiori dettagli, consulta la nostra {cookiePolicyLink}.

Impostazioni dei cookie

Centro assistenza vuoto

Ops. La pagina richiesta non esiste.

Home page

Search results

Deluso

Neutrale

Sorridente

Sto pensando...

Ricerca tra le origini...

Analisi...

I ticket inviati tramite Messenger o da un agente di supporto nella tua conversazione appariranno qui.

Comprensione dei Filtri di Sicurezza di Sonnet 4.5

Perché il mio messaggio è stato bloccato?

Cosa puoi fare

Evita i modelli che attivano falsi positivi

Altre opzioni

Perché i filtri?

Per ricercatori e applicazioni a doppio uso