De acordo com os padrões da indústria, a Anthropic usa uma variedade de robôs para coletar dados da web pública para desenvolvimento de modelos, para pesquisar a web e para recuperar conteúdo da web conforme direcionado pelos usuários. A Anthropic usa diferentes robôs para permitir transparência e escolha dos proprietários de sites. Abaixo está informação sobre os três robôs que a Anthropic usa e como definir suas preferências de site para permitir aqueles que você deseja que acessem seu conteúdo e limitar aqueles que você não deseja.
Bot | Uso | O que acontece quando você o desativa |
ClaudeBot | ClaudeBot ajuda a aprimorar a utilidade e segurança de nossos modelos de IA generativa coletando conteúdo da web que poderia potencialmente contribuir para seu treinamento. | Quando um site restringe o acesso do ClaudeBot, isso sinaliza que os materiais futuros do site devem ser excluídos de nossos conjuntos de dados de treinamento de modelos de IA. |
Claude-User | Claude-User oferece suporte aos usuários do Claude AI. Quando indivíduos fazem perguntas ao Claude, ele pode acessar sites usando um agente Claude-User. | Claude-User permite que proprietários de sites controlem quais sites podem ser acessados através dessas solicitações iniciadas pelo usuário. Desativar Claude-User em seu site impede que nosso sistema recupere seu conteúdo em resposta a uma consulta do usuário, o que pode reduzir a visibilidade do seu site para pesquisa na web direcionada pelo usuário. |
Claude-SearchBot | Claude-SearchBot navega pela web para melhorar a qualidade dos resultados de pesquisa para usuários. Ele analisa conteúdo online especificamente para aprimorar a relevância e precisão das respostas de pesquisa. | Desativar Claude-SearchBot em seu site impede que nosso sistema indexe seu conteúdo para otimização de pesquisa, o que pode reduzir a visibilidade do seu site e a precisão nos resultados de pesquisa do usuário. |
Como parte de nossa missão de construir sistemas de fronteira seguros e confiáveis e avançar o campo do desenvolvimento responsável de IA, estamos compartilhando os princípios pelos quais coletamos dados, bem como instruções sobre como optar por não participar de nosso rastreamento no futuro:
Nossa coleta de dados deve ser transparente. A Anthropic usa os Bots descritos acima para acessar conteúdo da web.
Nosso rastreamento não deve ser intrusivo ou disruptivo. Buscamos disrupção mínima sendo cuidadosos sobre a rapidez com que rastreamos os mesmos domínios e respeitando Crawl-delay quando apropriado.
Os Bots da Anthropic respeitam sinais de "não rastrear" honrando diretivas padrão da indústria em robots.txt.
Os Bots da Anthropic respeitam tecnologias anti-contorno (por exemplo, não tentaremos contornar CAPTCHAs para os sites que rastreamos.)
Para limitar a atividade de rastreamento, oferecemos suporte à extensão não padrão Crawl-delay para robots.txt. Um exemplo disso pode ser:
User-agent: ClaudeBot
Crawl-delay: 1
Para bloquear um Bot de todo o seu site, adicione isto ao arquivo robots.txt em seu diretório de nível superior. Por favor, faça isso para cada subdomínio do qual você deseja optar por não participar. Um exemplo disso é:
User-agent: ClaudeBot
Disallow: /
Optar por não ser rastreado pelos Bots da Anthropic requer modificar o arquivo robots.txt da maneira acima. Métodos alternativos como bloquear endereço(s) IP de onde os Bots da Anthropic operam podem não funcionar corretamente ou garantir persistentemente uma exclusão, pois isso prejudica nossa capacidade de ler seu arquivo robots.txt. Além disso, não publicamos atualmente intervalos de IP, pois usamos IPs públicos de provedores de serviços. Isso pode mudar no futuro.
Você pode aprender mais sobre nossas práticas de tratamento de dados e compromissos em nosso Help Center. Se você tiver outras dúvidas ou acreditar que nossos Bots possam estar com mau funcionamento, entre em contato com [email protected]. Por favor, entre em contato a partir de um email que inclua o domínio sobre o qual você está nos contatando, pois caso contrário é difícil verificar relatórios.
Você pode ser notificado de mudanças substanciais neste artigo clicando aqui e preenchendo o formulário:
