De acordo com os padrões da indústria, a Anthropic usa uma variedade de robôs para coletar dados da web pública para desenvolvimento de modelos, para pesquisar a web e recuperar conteúdo da web conforme direcionado pelos usuários. A Anthropic usa diferentes robôs para permitir transparência e escolha dos proprietários de sites. Abaixo está informação sobre os três robôs que a Anthropic usa e como definir suas preferências de site para permitir aqueles que você deseja que acessem seu conteúdo e limitar aqueles que você não deseja.
Robô | Uso | O que acontece quando você o desativa |
ClaudeBot | ClaudeBot ajuda a aprimorar a utilidade e segurança de nossos modelos de IA generativa coletando conteúdo da web que poderia potencialmente contribuir para seu treinamento. | Quando um site restringe o acesso do ClaudeBot, isso sinaliza que os materiais futuros do site devem ser excluídos de nossos conjuntos de dados de treinamento de modelos de IA. |
Claude-User | Claude-User oferece suporte aos usuários do Claude AI. Quando indivíduos fazem perguntas ao Claude, ele pode acessar sites usando um agente Claude-User. | Claude-User permite que proprietários de sites controlem quais sites podem ser acessados através dessas solicitações iniciadas pelo usuário. Desativar Claude-User em seu site impede que nosso sistema recupere seu conteúdo em resposta a uma consulta do usuário, o que pode reduzir a visibilidade do seu site para pesquisa na web direcionada pelo usuário. |
Claude-SearchBot | Claude-SearchBot navega pela web para melhorar a qualidade dos resultados de pesquisa para usuários. Ele analisa conteúdo online especificamente para aprimorar a relevância e precisão das respostas de pesquisa. | Desativar Claude-SearchBot em seu site impede que nosso sistema indexe seu conteúdo para otimização de pesquisa, o que pode reduzir a visibilidade e precisão do seu site nos resultados de pesquisa do usuário. |
Como parte de nossa missão de construir sistemas de fronteira seguros e confiáveis e avançar o campo do desenvolvimento responsável de IA, estamos compartilhando os princípios pelos quais coletamos dados, bem como instruções sobre como optar por não participar de nosso rastreamento no futuro:
Nossa coleta de dados deve ser transparente. A Anthropic usa os Robôs descritos acima para acessar conteúdo da web.
Nosso rastreamento não deve ser intrusivo ou disruptivo. Buscamos mínima disrupção sendo cuidadosos sobre a rapidez com que rastreamos os mesmos domínios e respeitando Crawl-delay quando apropriado.
Os Robôs da Anthropic respeitam sinais de "não rastrear" honrando diretivas padrão da indústria em robots.txt.
Os Robôs da Anthropic respeitam tecnologias anti-contorno (por exemplo, não tentaremos contornar CAPTCHAs para os sites que rastreamos.)
Para limitar a atividade de rastreamento, oferecemos suporte à extensão não padrão Crawl-delay para robots.txt. Um exemplo disso pode ser:
User-agent: ClaudeBot
Crawl-delay: 1
Para bloquear um Robô de todo o seu site, adicione isto ao arquivo robots.txt em seu diretório de nível superior. Por favor, faça isto para cada subdomínio do qual você deseja optar por não participar. Um exemplo disso é:
User-agent: ClaudeBot
Disallow: /
Optar por não participar de ser rastreado pelos Robôs da Anthropic requer modificar o arquivo robots.txt da maneira acima. Métodos alternativos como bloquear endereço(s) IP dos quais os Robôs da Anthropic operam podem não funcionar corretamente ou garantir persistentemente uma exclusão, pois fazer isso prejudica nossa capacidade de ler seu arquivo robots.txt. Além disso, não publicamos atualmente intervalos de IP, pois usamos IPs públicos de provedores de serviços. Isso pode mudar no futuro.
Você pode aprender mais sobre nossas práticas de tratamento de dados e compromissos em nosso Centro de Ajuda. Se você tiver outras dúvidas, ou acreditar que nossos Robôs possam estar com mau funcionamento, entre em contato conosco em [email protected]. Por favor, entre em contato a partir de um email que inclua o domínio sobre o qual você está nos contatando, pois caso contrário é difícil verificar relatórios.
