Este artigo explica por que uma solicitação pode ser bloqueada, o que acontece quando sua conversa muda para um modelo Claude diferente e como gerenciar a mudança automática.
Por que algumas solicitações são bloqueadas
As capacidades do Claude Fable 5 excedem em muito as de todos os modelos que disponibilizamos anteriormente. É o estado da arte em quase todos os benchmarks testados de capacidade de IA, demonstrando desempenho excepcional em engenharia de software, trabalho de conhecimento, visão e muitas outras áreas.
Lançar um modelo tão capaz traz riscos. Sem salvaguardas fortes, as capacidades avançadas do Claude Fable 5 em áreas como cibersegurança e biologia poderiam ser mal utilizadas por usuários para criar ataques cibernéticos em larga escala ou armas biológicas que poderiam resultar em danos catastróficos. Essas capacidades são a razão pela qual anteriormente apenas lançamos modelos da classe Mythos (como Claude Fable 5) para um pequeno número de parceiros selecionados e verificados.
Reconhecendo esses riscos, para permitir que usuários gerais acessem a grande maioria das capacidades do Fable 5, lançamos o modelo com salvaguardas que bloqueiam suas respostas em algumas áreas específicas, incluindo cibersegurança e biologia.
A maioria das consultas de usuários sobre esses tópicos receberá uma resposta do nosso próximo modelo mais capaz, Claude Opus 4.8. Estamos trabalhando para tornar essas salvaguardas mais discernentes, com o objetivo eventual de bloquear com precisão apenas os usos do modelo que se relacionam diretamente com riscos catastróficos, com menos falsos positivos do que há hoje.
Quais solicitações são bloqueadas
Claude Fable 5 executa verificações de segurança automatizadas em cada solicitação de usuário. Essas verificações destinam-se a bloquear solicitações em três áreas:
Técnicas ofensivas de cibersegurança, como construção de exploits, malware ou ferramentas de ataque
Consultas de biologia e ciências da vida, como métodos de laboratório ou mecanismos moleculares
Extração do pensamento resumido do modelo
Essas salvaguardas são intencionalmente amplas. Podem bloquear trabalho legítimo nessas áreas, incluindo testes de segurança autorizados e pesquisa de biologia benigna, e conversas normais e seguras que apenas tocam nesses tópicos—como documentação de negócios de biotecnologia, imagem médica e diagnósticos, questões de saúde clínica e diagnóstica, ou conteúdo educacional básico em biologia.
As verificações também analisam tudo o que o modelo lê, não apenas sua mensagem mais recente—incluindo memória, conteúdo de conectores, resultados de pesquisa na web e arquivos, portanto um bloqueio pode ser acionado por conteúdo que você não digitou.
O que acontece após um bloqueio
Por padrão, a mudança automática de modelo está ativa no Claude, Claude Cowork, Claude Code, Claude Design e Claude para Microsoft 365. Neste caso, Claude executa novamente sua solicitação bloqueada do Claude Fable 5 no Claude Opus 4.8 na mesma conversa. Você verá um aviso explicando que o modelo mudou, e a resposta será rotulada com o modelo que respondeu. Opus é um modelo altamente capaz com salvaguardas fortes próprias, e para a maioria das solicitações legítimas bloqueadas no Fable 5—incluindo a maioria das questões de biologia—Opus deve lhe dar uma resposta útil.
Após a mudança, o seletor de modelo permanece no Opus pelo resto da conversa. Você pode voltar para Claude Fable 5 a qualquer momento no seletor de modelo.
Nota: Se você voltar sem alterar nada, as mesmas salvaguardas podem bloquear a conversa novamente porque a solicitação original ainda faz parte dela. Editar sua mensagem antes de tentar novamente geralmente ajuda.
Se a solicitação também for bloqueada no Opus
Opus tem seus próprios sistemas de segurança. Se sua solicitação também for bloqueada no Opus, você pode editar sua mensagem e tentar novamente. Para cibersegurança especificamente, se seu caso de uso tem um propósito defensivo legítimo e está sendo afetado por essas salvaguardas, você pode se inscrever no Programa de Verificação de Cibersegurança (CVP) para Opus. Saiba mais sobre salvaguardas de cibersegurança em tempo real e o Programa de Verificação de Cibersegurança.
Gerenciar mudança automática de modelo
A mudança automática está ativada por padrão na primeira vez que você seleciona Claude Fable 5. Permanece ativada por padrão e você pode desativá-la a qualquer momento:
Vá para Configurações > Capacidades (ou Config > MODELO E SAÍDA no Claude Code).
Desative Mudar modelos quando uma mensagem é sinalizada.
Com a mudança automática de modelo desativada, uma solicitação bloqueada pausa a conversa em vez de mudar de modelo. Você pode então:
Editar sua mensagem e tentar novamente no Claude Fable 5
Enviar a mesma mensagem para Opus manualmente
Uso e faturamento
Solicitações bloqueadas são faturadas de forma diferente dependendo de quando o bloqueio ocorre:
Bloqueado na entrada: Se uma solicitação for bloqueada antes do Claude Fable 5 produzir qualquer saída, a conversa muda para Opus imediatamente. Você é cobrado apenas com as taxas do Opus, e a resposta do Opus conta para seu limite de uso ou consumo.
Bloqueado no meio do caminho: Se uma solicitação for bloqueada no meio do caminho, a entrada e os tokens transmitidos antes do bloqueio são cobrados com as taxas do Claude Fable 5. O resto da resposta é cobrado com as taxas do Opus.
Enviar feedback
Se sua solicitação bloqueada parecer não relacionada a tópicos de segurança ou biologia, ou se seu trabalho legítimo nessas áreas continuar sendo bloqueado, nos avise. Use "Enviar feedback" para denunciá-lo. Relatórios de solicitações bloqueadas incorretamente nos ajudam a estreitar e melhorar essas salvaguardas.
Fique atento a atualizações
Avançando, planejamos considerar maneiras de abrir alocações para pesquisa de defesa cibernética de uso duplo e biologia. À medida que nossos sistemas de segurança amadurecem, nosso objetivo é apoiar trabalho legítimo em biologia e cibersegurança defensiva, mantendo proteções fortes contra uso indevido.
Compartilharemos mais detalhes sobre o programa, incluindo elegibilidade e como se inscrever, conforme ficarem disponíveis. Fique atento a este Centro de Ajuda para atualizações, ou inscreva-se para notificações aqui.
Onde a mudança automática de modelo se aplica
A mudança automática de modelo funciona da mesma forma em todos os lugares onde você pode usar Claude Fable 5:
Claude na web
Claude Mobile
Claude Desktop
Claude Cowork
Claude Code
Claude Design
Claude para Microsoft 365
Claude para Teams
Claude no Slack
Importante: Se você estiver usando a API Claude, a mudança de modelo funciona de forma diferente. A mudança automática não é automática, e os clientes da API devem optar por e configurar a mudança na API. Consulte a documentação do desenvolvedor para obter detalhes.
Leia nosso blog para saber mais sobre Claude Fable 5: Claude Fable 5 e Claude Mythos 5.
