Orientações de segurança infantil para desenvolvedores

Nossos compromissos com a segurança infantil

A Anthropic adota uma abordagem de Segurança por Design para a segurança infantil. Somos signatários dos Princípios de Segurança por Design para IA Generativa da Thorn e All Tech Is Human e relatamos nosso progresso no Hub de Transparência. Na prática, isso significa que aplicamos treinamento de segurança projetado para fazer nossos modelos recusarem solicitações que sexualizem ou coloquem em risco menores, operamos sistemas de detecção e monitoramento em nossos serviços e relatamos aparente CSAM e outras formas de exploração infantil ao National Center for Missing & Exploited Children (NCMEC). Nossos serviços de consumidor próprios são restritos a usuários com 18 anos ou mais, e Claude não produz saída de imagem ou vídeo fotorrealista.

Essas proteções se aplicam em toda a nossa plataforma. Como você controla o design do seu produto, base de usuários e fluxos de conteúdo, você está melhor posicionado para abordar riscos específicos da sua implantação.

Suas obrigações sob a Política de Uso da Anthropic

Todos os desenvolvedores que constroem na API da Anthropic são obrigados a cumprir nossa Política de Uso, que proíbe usar nossos produtos ou serviços para comprometer a segurança das crianças. Isso inclui, entre outras coisas, criar, distribuir ou promover CSAM, incluindo CSAM gerado por IA; facilitar grooming, tráfico, sextorsão ou outra exploração de um menor; e sexualizar menores em qualquer contexto, incluindo ficção ou roleplay.

Essas obrigações se aplicam independentemente do tamanho ou caso de uso da sua plataforma. Embora você já possa proibir essa atividade, seus usuários finais ou clientes podem fazer upload de CSAM, solicitar conteúdo sexualizado envolvendo menores ou usar saídas para facilitar grooming ou sextorsão. Você é responsável por implementar salvaguardas apropriadas contra esses riscos em sua implantação. Monitoramos o uso da API para violações da Política de Uso e tomamos medidas de execução consistentes com nossas políticas e obrigações legais.

Além disso, se seu produto permitir que menores interajam diretamente com nossos modelos, consulte nossas Diretrizes para Organizações que Servem Menores, que estabelece as salvaguardas adicionais que a Anthropic exige para esse público. Esta orientação abrange uma série de medidas possíveis, incluindo, mas não limitado a sistemas de verificação de idade, moderação e filtragem de conteúdo, mecanismos de monitoramento e relatório e requisitos de conformidade regulatória e divulgação.

Quer você tenha recebido uma notificação da Anthropic sobre conteúdo proibido ou esteja construindo proativamente suas salvaguardas, os recursos abaixo podem ajudá-lo a se orientar na implementação de infraestrutura de detecção, relatório e resposta apropriada para sua plataforma.

Construindo um programa de segurança infantil

Não existe uma arquitetura única correta para um programa de segurança infantil. A abordagem viável depende de sua plataforma; seu tamanho; as superfícies onde os usuários podem se envolver, enviar ou gerar conteúdo; e sua jurisdição. Muitas plataformas já construíram capacidades de prevenção e resposta adequadas aos seus próprios contextos, e o campo desenvolveu orientações compartilhadas, ferramentas e infraestrutura de relatório que programas mais novos podem aproveitar. As organizações abaixo oferecem recursos que muitas plataformas usam como ponto de partida. A Anthropic não exige que você use nenhum fornecedor ou programa específico.

Princípios de design. Thorn e All Tech Is Human publicaram Segurança por Design para IA Generativa, um conjunto de princípios e mitigações práticas para prevenir abuso sexual infantil nas fases de desenvolvimento, implantação e manutenção de um produto de IA. A Anthropic é signatária desses princípios, e encorajamos desenvolvedores que constroem em nossos modelos a considerá-los ao projetar suas próprias salvaguardas.

Serviços de detecção e bloqueio. Se sua implantação permitir que os usuários façam upload ou gerem imagens ou vídeos, ou interajam com outros usuários, você pode implementar detecção em sua própria infraestrutura. As organizações podem optar por construir classificadores personalizados adaptados ao seu modelo de ameaça, embora para muitos, uma solução de fornecedor ou parceiro possa ser o caminho mais prático. Existem vários provedores que oferecem soluções de correspondência de hash, imagem, vídeo ou classificador de texto. Por exemplo, uma opção amplamente implantada é Safer da Thorn, que fornece correspondência de hash contra CSAM conhecido e classificadores para material novo e sinais de grooming. A Internet Watch Foundation (IWF) oferece a suas empresas membros uma suíte de serviços para detectar, bloquear e responder a CSAM em suas plataformas, incluindo listas de hash e uma lista de bloqueio de URL. O programa Pathways da Tech Coalition (descrito abaixo) pode ajudar as empresas a avaliar e acessar opções de detecção adequadas à sua plataforma.

Desenvolvimento de programa e orientação operacional. A Tech Coalition é uma aliança industrial focada em prevenir exploração e abuso sexual infantil online. Seu programa gratuito Pathways é projetado para startups e plataformas pequenas a médias e fornece modelos para construir um programa de segurança infantil, orientação sobre detecção de CSAM e relatório do NCMEC, insight sobre requisitos regulatórios globais e suporte em riscos emergentes, como sextorsão financeira e danos gerados por IA. A Anthropic é membro da Tech Coalition. Você pode entrar em contato com a equipe da Tech Coalition para uma consulta inicial.

Relatório. Plataformas baseadas nos EUA com conhecimento real de aparente CSAM são legalmente obrigadas a relatar à CyberTipline do NCMEC. As plataformas podem se registrar no NCMEC para obter acesso ao sistema de relatório CyberTipline, e o NCMEC publica recursos legais adicionais sobre obrigações de relatório. Plataformas operando em outras jurisdições devem consultar requisitos de relatório locais; INHOPE mantém um diretório de linhas diretas nacionais. Conforme você constrói seu programa, considere incorporar logging para fins de relatório de transparência.

Esta página é fornecida apenas para fins informativos e não constitui aconselhamento jurídico ou endosso pela Anthropic. Consulte seu próprio conselho jurídico sobre suas obrigações específicas.