Perché Claude ha cambiato modello nella tua conversazione con Fable 5

Questo articolo spiega perché una richiesta potrebbe essere bloccata, cosa accade quando la tua conversazione passa a un modello Claude diverso e come gestire il cambio automatico.

Perché alcune richieste vengono bloccate

Le capacità di Claude Fable 5 superano di gran lunga quelle di ogni modello che abbiamo precedentemente reso disponibile al pubblico. È all'avanguardia in quasi tutti i benchmark testati delle capacità di IA, mostrando prestazioni eccezionali nell'ingegneria del software, nel lavoro intellettuale, nella visione artificiale e in molte altre aree.

Il rilascio di un modello così capace comporta rischi. Senza forti misure di sicurezza, le capacità avanzate di Claude Fable 5 in aree come la sicurezza informatica e la biologia potrebbero essere utilizzate in modo improprio dagli utenti per creare attacchi informatici su larga scala o armi biologiche che potrebbero causare danni catastrofici. Queste capacità sono il motivo per cui in precedenza abbiamo rilasciato solo modelli di classe Mythos (come Mythos Preview) a un piccolo numero di partner selezionati e verificati.

Riconoscendo questi rischi, per consentire agli utenti generali di accedere alla stragrande maggioranza delle capacità di Fable 5, abbiamo lanciato il modello con misure di sicurezza che bloccano le sue risposte in alcune aree specifiche in conformità con i nostri Termini di servizio e Politica di utilizzo accettabile. Abbiamo anche continuato a iterare sulle misure di sicurezza dal nostro primo lancio di Claude Fable 5.

La maggior parte delle query degli utenti bloccate da queste misure di sicurezza su Fable 5 potrebbe invece ricevere una risposta dal nostro modello più capace successivo, Claude Opus 4.8 (cioè, "fallback"). Stiamo lavorando per rendere queste misure di sicurezza più discriminanti per bloccare precisamente gli usi del modello che si riferiscono direttamente ai rischi di targeting, con meno falsi positivi rispetto a oggi.

Quali richieste potrebbero avere fallback

Claude Fable 5 esegue controlli di sicurezza automatizzati su ogni richiesta dell'utente. Questi controlli sono destinati a eseguire visibilmente il fallback da Fable 5 a un modello non-Mythos (ad es. Opus 4.8) quando gli utenti inviano richieste in quattro aree:

Tecniche offensive di sicurezza informatica, come la creazione di exploit, malware o strumenti di attacco. Claude Fable 5 può assistere con attività di sicurezza informatica di routine, ma gli utenti dovrebbero aspettarsi elevati tassi di fallback. Le misure di sicurezza sono progettate per bloccare l'accesso alle capacità di livello Mythos.
Maggior parte delle query di biologia, chimica e scienze della vita, come metodi di laboratorio o meccanismi molecolari. Nel breve termine, questo potrebbe influire sulla capacità del modello di aiutare con la ricerca biologica benigna e argomenti correlati, come la documentazione aziendale biotecnologica, l'imaging medico e la diagnostica, le domande di assistenza sanitaria clinica e diagnostica, o contenuti educativi di base in biologia.
Attacchi di distillazione su Fable 5, inclusi i tentativi di estrarre il pensiero sintetizzato del modello.
Un insieme ristretto di attività di sviluppo LLM frontier, come l'infrastruttura di addestramento distribuito, la progettazione di acceleratori ML e lo sviluppo del kernel per determinati chip non standard.

Queste misure di sicurezza di blocco sono intenzionalmente ampie e lavoriamo continuamente per migliorare le misure di sicurezza per ridurre il loro impatto sull'esperienza dell'utente. Quando le richieste vengono bloccate, potrebbero avere fallback a un modello non-Mythos, attualmente Opus 4.8.

I controlli esaminano anche tutto ciò che il modello legge, non solo il tuo ultimo messaggio, inclusa la memoria, il contenuto dai connettori, i risultati della ricerca web e i file, quindi un blocco può essere attivato da contenuto che non hai digitato.

Cosa accade dopo un blocco

Per impostazione predefinita, il cambio automatico del modello è attivo in Claude, Claude Cowork, Claude Code, Claude Design e Claude per Microsoft 365. Quando si cambiano automaticamente i modelli, Claude riesegue la tua richiesta bloccata di Claude Fable 5 su Claude Opus 4.8 nella stessa conversazione. Vedrai un avviso che spiega che il modello è cambiato e la risposta sarà etichettata con il modello che ha risposto. Opus è un modello altamente capace con forti misure di sicurezza proprie e, per la maggior parte delle richieste altrimenti legittime bloccate su Fable 5, Opus dovrebbe darti una risposta utile.

Dopo il cambio, il selettore del modello rimane su Opus per il resto della conversazione. Puoi tornare a Claude Fable 5 in qualsiasi momento dal selettore del modello.

Nota: Se torni a Claude Fable 5 dopo che si verifica un cambio automatico del modello, tieni presente che le stesse misure di sicurezza di Fable 5 potrebbero bloccare di nuovo la conversazione perché la richiesta originale è ancora parte di essa. Modificare il messaggio precedente prima di riprovare spesso aiuta.

Se la richiesta viene bloccata anche su Opus

Opus ha i suoi sistemi di sicurezza. Se la tua richiesta viene bloccata anche su Opus, puoi modificare il tuo messaggio e riprovare. Per la sicurezza informatica in particolare, se il tuo caso d'uso ha uno scopo difensivo legittimo ed è interessato da queste misure di sicurezza, puoi candidarti al Cyber Verification Program (CVP) per Opus. Scopri di più su misure di sicurezza informatica in tempo reale e il Cyber Verification Program.

Gestisci il cambio automatico del modello

Il cambio automatico è abilitato per impostazione predefinita la prima volta che selezioni Claude Fable 5. Rimane attivo per impostazione predefinita e puoi disattivarlo in qualsiasi momento:

Vai a Impostazioni > Capacità (o Config > MODELLO E OUTPUT in Claude Code).
Disattiva Cambia modello quando un messaggio viene contrassegnato.

Con il cambio automatico del modello disattivato, una richiesta bloccata mette in pausa la conversazione invece di cambiare modello. Puoi quindi:

Modifica il tuo messaggio e riprova su Claude Fable 5
Invia lo stesso messaggio a Opus manualmente

Utilizzo e fatturazione

Le richieste bloccate vengono fatturate diversamente a seconda di quando si verifica il blocco:

Bloccato all'input: Se una richiesta viene bloccata prima che Claude Fable 5 produca alcun output, la conversazione passa immediatamente a Opus. Ti viene addebitato solo alle tariffe di Opus e la risposta di Opus conta verso il tuo limite di utilizzo o consumo.
Bloccato a metà flusso: Se una richiesta viene bloccata a metà flusso, l'input e i token trasmessi prima del blocco vengono addebitati alle tariffe di Claude Fable 5. Il resto della risposta viene addebitato alle tariffe di Opus.

Fornisci feedback

Se la tua richiesta bloccata sembra non correlata a argomenti di sicurezza o biologia, o se il tuo lavoro legittimo in queste aree continua a essere bloccato, faccelo sapere. Usa "Invia feedback" per segnalarlo. Le segnalazioni di richieste bloccate in modo errato ci aiutano a restringere e migliorare queste misure di sicurezza.

Rimani sintonizzato per gli aggiornamenti

In futuro, intendiamo considerare modi per aprire allocazioni per la ricerca di difesa informatica e biologia a doppio uso. Man mano che i nostri sistemi di sicurezza maturano, miriamo a supportare il lavoro legittimo di biologia e sicurezza informatica difensiva mantenendo forti protezioni contro l'uso improprio.

Condivideremo più dettagli sul programma, inclusi i criteri di idoneità e come candidarsi, non appena disponibili. Guarda questo Centro assistenza per gli aggiornamenti, o iscriviti alle notifiche qui.

Dove si applica il cambio automatico del modello

Il cambio automatico del modello funziona allo stesso modo ovunque tu possa usare Claude Fable 5:

Claude sul web
Claude Mobile
Claude Desktop
Claude Cowork
Claude Code
Claude Design
Claude per Microsoft 365
Claude per Teams
Claude in Slack
Claude Tag

Importante: Se stai utilizzando l'API Claude, il cambio del modello funziona diversamente. Il cambio automatico non è automatico e i clienti API devono optare e configurare il cambio nell'API. Consulta la documentazione per sviluppatori per i dettagli.

Leggi il nostro blog per saperne di più su Claude Fable 5: Claude Fable 5 e Claude Mythos 5.