Anthropic

Claude Sonnet 4.5 inclui proteções de <a href="https://www.anthropic.com/news/activating-asl3-protections" rel="nofollow noopener noreferrer" target="_blank">Nível de Segurança de IA 3 (ASL-3)</a> projetadas para prevenir o uso indevido relacionado a armas químicas, biológicas, radiológicas e nucleares (CBRN). Essas medidas de segurança incluem filtros chamados classificadores que detectam entradas e saídas potencialmente perigosas.

Os filtros de segurança do Sonnet 4.5 têm o objetivo de prevenir assistência em tarefas relacionadas a armas CBRN (Químicas, Biológicas, Radiológicas e Nucleares). Se você recebeu uma mensagem de erro, os filtros detectaram conteúdo que correspondia a padrões associados a essas ameaças específicas.

Esses filtros ainda estão sendo refinados e podem ocasionalmente sinalizar conteúdo normal de forma incorreta. Como em qualquer sistema automatizado, falsos positivos podem ocorrer — o que significa que consultas legítimas podem ser sinalizadas incorretamente ocasionalmente. Estamos trabalhando ativamente para melhorar a precisão desses classificadores para minimizar interrupções mantendo a segurança.

Se você acredita que sua mensagem está sendo bloqueada em resposta a um uso legítimo, você tem várias opções:

Evite padrões que acionem falsos positivos

Os classificadores são sensíveis a certos padrões que podem se assemelhar a tentativas de jailbreak ou técnicas de ofuscação:

Evite conteúdo semelhante a cifra: Strings codificadas em Base64, hashes de commit do git, sequências hexadecimais e outros dados codificados podem acionar os filtros. Se você precisar incluir tal conteúdo, inclua conteúdo ao seu redor para explicar como e por que é usado.

- Evite conteúdo semelhante a cifra: Strings codificadas em Base64, hashes de commit do git, sequências hexadecimais e outros dados codificados podem acionar os filtros. Se você precisar incluir tal conteúdo, inclua conteúdo ao seu redor para explicar como e por que é usado.

Simplifique as instruções: Prompts de sistema excessivamente longos ou complexos que incluem lógica condicional intrincada podem se assemelhar a tentativas de ofuscar o comportamento. Mantenha os prompts <a href="https://docs.claude.com/en/docs/build-with-claude/prompt-engineering/overview" rel="nofollow noopener noreferrer" target="_blank">claros e diretos</a>.

- Simplifique as instruções: Prompts de sistema excessivamente longos ou complexos que incluem lógica condicional intrincada podem se assemelhar a tentativas de ofuscar o comportamento. Mantenha os prompts <a href="https://docs.claude.com/en/docs/build-with-claude/prompt-engineering/overview" rel="nofollow noopener noreferrer" target="_blank">claros e diretos</a>.

Tenha cuidado com conteúdo relacionado à biologia: Se sua aplicação não exigir especificamente informações biológicas ou químicas, considere reformular as solicitações para evitar esses tópicos quando possível.

- Tenha cuidado com conteúdo relacionado à biologia: Se sua aplicação não exigir especificamente informações biológicas ou químicas, considere reformular as solicitações para evitar esses tópicos quando possível.

Continue com Claude Sonnet 4: Você pode mudar para Claude Sonnet 4 para o restante da conversa, que usa medidas de segurança diferentes e pode ser capaz de ajudar com sua solicitação.

- Continue com Claude Sonnet 4: Você pode mudar para Claude Sonnet 4 para o restante da conversa, que usa medidas de segurança diferentes e pode ser capaz de ajudar com sua solicitação.

Envie feedback: Você pode nos informar, pois seu feedback nos ajuda a melhorar a precisão do filtro.

- Envie feedback: Você pode nos informar, pois seu feedback nos ajuda a melhorar a precisão do filtro.

Edite sua mensagem: Você pode tentar reformular sua pergunta ou fornecer contexto adicional sobre seu caso de uso legítimo.

- Edite sua mensagem: Você pode tentar reformular sua pergunta ou fornecer contexto adicional sobre seu caso de uso legítimo.

À medida que os modelos de IA se tornam mais capazes, eles exigem proteções mais fortes contra possíveis usos indevidos. As medidas de implantação ASL-3 do Sonnet 4.5 fazem parte da <a href="https://www.anthropic.com/news/activating-asl3-protections" rel="nofollow noopener noreferrer" target="_blank">Política de Escalabilidade Responsável</a> da Anthropic, que garante que modelos cada vez mais capazes tenham salvaguardas apropriadas.

Os filtros são especificamente projetados para prevenir fluxos de trabalho CBRN estendidos e de ponta a ponta que poderiam representar riscos catastróficos. Eles não se destinam a bloquear discussões científicas gerais, conteúdo educacional ou informações comumente disponíveis.

Para pesquisadores e aplicações de duplo uso

Se você está trabalhando em pesquisa científica e precisa de acesso para fins legítimos, estabelecemos sistemas de controle de acesso para usuários verificados. Entre em contato com nossa <a href="https://support.claude.com">equipe de suporte</a> para saber mais.

Compreendendo os Filtros de Segurança do Sonnet 4.5

Terms of Service - Consumer

Product

Research

Terms of Service - Commercial

Privacy Policy

Company

Usage Policy

News

Responsible Disclosure Policy

Careers

Compliance

Encontre respostas e obtenha ajuda da Assistência da Intercom e de Especialistas da Comunidade

As conversas que iniciou pelo mensageiro aparecerão aqui.

Nenhuma conversa criada por si

Tente utilizar palavras-chave diferentes ou verificar se existem erros de digitação.

Tente utilizar palavras-chave ou filtros diferentes.

Nenhuma conversa encontrada

Título

Este site utiliza cookies e outras tecnologias que nós e os nossos fornecedores terceiros utilizamos para monitorizar e registar informações pessoais sobre si, bem como as suas interações com o site (incluindo o conteúdo consultado, movimentos do cursor, gravações de ecrã e conteúdo de conversas) para os fins descritos na nossa Política de Cookies. Ao continuar a visitar o nosso site, concorda com os nossos {websiteTermsLink}, {privacyPolicyLink} e {cookiePolicyLink}.

Este site utiliza cookies e tecnologias semelhantes ("cookies") na medida do estritamente necessário para o funcionamento do site. Nós e os nossos parceiros também gostaríamos de instalar cookies adicionais para permitir a análise do desempenho do site, a funcionalidade, a publicidade e as caraterísticas das redes sociais. Consulte a nossa {cookiePolicyLink} para saber mais. Pode alterar as suas preferências de cookies nas nossas Definições de cookies.

Utilizamos cookies para o funcionamento do nosso site, bem como para fins de análise e publicidade. Pode ativar ou desativar os cookies opcionais, conforme desejado. Consulte a nossa {cookiePolicyLink} para obter mais informações.

Os cookies de publicidade são definidos pelos nossos parceiros publicitários para recolher informações sobre a sua utilização do site, das nossas comunicações e de outros serviços online ao longo do tempo, em diferentes navegadores e dispositivos. Utilizam essas informações para lhe apresentar anúncios online que consideram relevantes e para medir o desempenho dos mesmos. Os cookies de redes sociais são definidos pelas respetivas plataformas para lhe permitir partilhar conteúdos nesses serviços, podendo também recolher dados sobre a sua atividade noutros serviços online, conforme descrito nas respetivas políticas de privacidade.

Estes cookies permitem que o website ofereça funcionalidades avançadas e personalização. Podem ser definidos por nós ou por fornecedores terceiros cujos serviços foram integrados nas nossas páginas. Se não autorizar estes cookies, alguns ou todos esses serviços poderão não funcionar corretamente.

Estes cookies são necessários para o funcionamento do website e não podem ser desligados nos nossos sistemas.

Estes cookies permitem contar visitas e origens de tráfego, para que possamos medir e melhorar o desempenho do nosso site. Ajudam-nos a saber quais as páginas mais e menos populares e a compreender como os visitantes navegam no site.

Tens o direito de te opores à venda das tuas informações pessoais. Consulta a nossa {cookiePolicyLink} para obter mais informações sobre a forma como utilizamos os teus dados.

As suas Opções de privacidade

Utilizamos cookies para melhorar a tua experiência. Podes personalizar as tuas preferências de cookies abaixo. Consulta a nossa {cookiePolicyLink} para obter mais informações.

Definições de cookies

Centro de Ajuda vazio

Ups! Essa página não existe.

Início

Resultados da pesquisa

Desapontado(a)

Neutro(a)

Sorriso

A pensar...

A procurar nas fontes...

A analisar...

Os tickets enviados através do messenger ou por um agente de suporte na sua conversa aparecerão aqui.

Compreendendo os Filtros de Segurança do Sonnet 4.5

Por que minha mensagem foi bloqueada?

O que você pode fazer

Evite padrões que acionem falsos positivos

Outras opções

Por que os filtros?

Para pesquisadores e aplicações de duplo uso