Questo articolo spiega perché una richiesta potrebbe essere bloccata, cosa accade quando la tua conversazione passa a un modello Claude diverso e come gestire il cambio automatico.
Perché alcune richieste vengono bloccate
Le capacità di Claude Fable 5 superano di gran lunga quelle di ogni modello che abbiamo precedentemente reso disponibile al pubblico. È all'avanguardia in quasi tutti i benchmark testati delle capacità di IA, mostrando prestazioni eccezionali nell'ingegneria del software, nel lavoro intellettuale, nella visione artificiale e in molte altre aree.
Il rilascio di un modello così capace comporta rischi. Senza forti misure di sicurezza, le capacità avanzate di Claude Fable 5 in aree come la sicurezza informatica e la biologia potrebbero essere utilizzate in modo improprio dagli utenti per creare attacchi informatici su larga scala o armi biologiche che potrebbero causare danni catastrofici. Queste capacità sono il motivo per cui in precedenza abbiamo rilasciato solo modelli di classe Mythos (come Claude Fable 5) a un piccolo numero di partner selezionati e verificati.
Riconoscendo questi rischi, per consentire agli utenti generali di accedere alla stragrande maggioranza delle capacità di Fable 5, abbiamo lanciato il modello con misure di sicurezza che bloccano le sue risposte in alcune aree specifiche, inclusa la sicurezza informatica e la biologia.
La maggior parte delle query degli utenti su questi argomenti riceverà invece una risposta dal nostro modello più capace successivo, Claude Opus 4.8. Stiamo lavorando per rendere queste misure di sicurezza più discriminanti, con l'obiettivo finale di bloccare precisamente solo gli usi del modello che si riferiscono direttamente a rischi catastrofici, con meno falsi positivi rispetto a oggi.
Quali richieste vengono bloccate
Claude Fable 5 esegue controlli di sicurezza automatizzati su ogni richiesta dell'utente. Questi controlli sono destinati a bloccare le richieste in tre aree:
Tecniche di sicurezza informatica offensiva, come la creazione di exploit, malware o strumenti di attacco
Query di biologia e scienze della vita, come metodi di laboratorio o meccanismi molecolari
Estrazione del pensiero riassunto del modello
Queste misure di sicurezza sono intenzionalmente ampie. Potrebbero bloccare lavori legittimi in queste aree, inclusi test di sicurezza autorizzati e ricerca biologica benigna, e conversazioni normali e sicure che toccano solo questi argomenti, come documentazione aziendale biotecnologica, imaging medico e diagnostica, domande sanitarie cliniche e diagnostiche, o contenuti educativi di base in biologia.
I controlli esaminano anche tutto ciò che il modello legge, non solo il tuo ultimo messaggio, inclusa la memoria, il contenuto dai connettori, i risultati della ricerca web e i file, quindi un blocco può essere attivato da contenuto che non hai digitato.
Cosa accade dopo un blocco
Per impostazione predefinita, il cambio automatico del modello è attivo in Claude, Claude Cowork, Claude Code, Claude Design e Claude per Microsoft 365. In questo caso, Claude esegue nuovamente la tua richiesta bloccata di Claude Fable 5 su Claude Opus 4.8 nella stessa conversazione. Vedrai un avviso che spiega che il modello è cambiato e la risposta sarà etichettata con il modello che ha risposto. Opus è un modello altamente capace con forti misure di sicurezza proprie e, per la maggior parte delle richieste altrimenti legittime bloccate su Fable 5, inclusa la maggior parte delle domande di biologia, Opus dovrebbe darti una risposta utile.
Dopo il cambio, il selettore del modello rimane su Opus per il resto della conversazione. Puoi tornare a Claude Fable 5 in qualsiasi momento dal selettore del modello.
Nota: Se torni indietro senza cambiare nulla, le stesse misure di sicurezza potrebbero bloccare di nuovo la conversazione perché la richiesta originale è ancora parte di essa. Modificare il messaggio prima di riprovare spesso aiuta.
Se la richiesta è bloccata anche su Opus
Opus ha i suoi sistemi di sicurezza. Se la tua richiesta è bloccata anche su Opus, puoi modificare il messaggio e riprovare. Per la sicurezza informatica in particolare, se il tuo caso d'uso ha uno scopo difensivo legittimo ed è interessato da queste misure di sicurezza, puoi candidarti al Cyber Verification Program (CVP) per Opus. Scopri di più su misure di sicurezza informatica in tempo reale e il Cyber Verification Program.
Gestisci il cambio automatico del modello
Il cambio automatico è abilitato per impostazione predefinita la prima volta che selezioni Claude Fable 5. Rimane abilitato per impostazione predefinita e puoi disattivarlo in qualsiasi momento:
Vai a Impostazioni > Capacità (o Config > MODELLO E OUTPUT in Claude Code).
Disattiva Cambia modello quando un messaggio è contrassegnato.
Con il cambio automatico del modello disattivato, una richiesta bloccata mette in pausa la conversazione invece di cambiare modello. Puoi quindi:
Modifica il tuo messaggio e riprova su Claude Fable 5
Invia lo stesso messaggio a Opus manualmente
Utilizzo e fatturazione
Le richieste bloccate vengono fatturate diversamente a seconda di quando si verifica il blocco:
Bloccato all'input: Se una richiesta è bloccata prima che Claude Fable 5 produca alcun output, la conversazione passa immediatamente a Opus. Ti viene addebitato solo alle tariffe di Opus e la risposta di Opus conta verso il tuo limite di utilizzo o consumo.
Bloccato a metà: Se una richiesta è bloccata a metà, l'input e i token trasmessi prima del blocco vengono addebitati alle tariffe di Claude Fable 5. Il resto della risposta viene addebitato alle tariffe di Opus.
Invia feedback
Se la tua richiesta bloccata sembra non correlata a argomenti di sicurezza o biologia, o se il tuo lavoro legittimo in queste aree continua a essere bloccato, faccelo sapere. Usa "Invia feedback" per segnalarlo. Le segnalazioni di richieste bloccate in modo errato ci aiutano a restringere e migliorare queste misure di sicurezza.
Rimani in attesa di aggiornamenti
In futuro, intendiamo considerare modi per aprire allocazioni per la ricerca di difesa informatica e biologia a doppio uso. Man mano che i nostri sistemi di sicurezza maturano, miriamo a supportare il lavoro legittimo di biologia e sicurezza informatica difensiva mantenendo forti protezioni contro l'uso improprio.
Condivideremo più dettagli sul programma, inclusi i criteri di idoneità e come candidarsi, non appena disponibili. Controlla questo Centro assistenza per gli aggiornamenti, o iscriviti alle notifiche qui.
Dove si applica il cambio automatico del modello
Il cambio automatico del modello funziona allo stesso modo ovunque tu possa usare Claude Fable 5:
Claude sul web
Claude Mobile
Claude Desktop
Claude Cowork
Claude Code
Claude Design
Claude per Microsoft 365
Claude per Teams
Claude in Slack
Importante: Se stai utilizzando l'API Claude, il cambio del modello funziona diversamente. Il cambio automatico non è automatico e i clienti API devono optare e configurare il cambio nell'API. Consulta la documentazione per gli sviluppatori per i dettagli.
Leggi il nostro blog per saperne di più su Claude Fable 5: Claude Fable 5 e Claude Mythos 5.
