Iniciação rápida
-
Política Pick
Permitir todos os caminhos por padrão ou lista Não permitir.
-
Adicionar Sitemap
Use o URL completo sitemap.xml.
Configure os caminhos Permitir / Deshabilitar e o URL do mapa do site para gerar um arquivo robots.txt padrão.
Privacidade: processado localmente, nunca carregado.
↓ Colar na área de entrada abaixo para ver os resultados instantaneamente
生成 robots.txt 爬虫规则草案,可指定 sitemap 与 Disallow 路径。
User-agent: * Allow: / Sitemap: https://example.com/sitemap.xml
将输出保存为站点根目录 /robots.txt; 生产环境请结合 SEO 策略调整规则。
Configure os caminhos Permitir / Deshabilitar e o URL do mapa do site para gerar um arquivo robots.txt padrão.
Política Pick
Permitir todos os caminhos por padrão ou lista Não permitir.
Adicionar Sitemap
Use o URL completo sitemap.xml.
Salve como /robots.txt na raiz do seu site; evite CDN que serve cópias obsoletas.
Ao usar o gerador robots.txt, primeiro identifique diretórios sensíveis para bloquear (por exemplo, /admin/ ou /tmp/), mantendo as páginas públicas acessíveis. A ferramenta oferece caixas de verificação visuais para criar regras de desaprovação sem codificação manual. Finalmente, adicione o URL do mapa do site e clique em gerar para obter um arquivo compatível com os padrões para todos os motores de busca.
Após a geração, válido o comportamento do rastreador em um ambiente de teste primeiro. Use o testador robots.txt do Google Search Console para verificar a eficácia da regra. Uma vez confirmado, faça upload do arquivo para a raiz do seu site. Observação: as alterações podem demorar 24 - 48 horas para se propagar, monitore os logs do rastreador durante esse período.
Input
Allow all + sitemap
Output
User-agent: * Allow: / Sitemap: ...
Regras Wildcard * somente; adicione blocos específicos de bot manualmente, se necessário.
Os mecanismos de busca armazenam em cache arquivos robots.txt periodicamente (normalmente 24 - 48 horas). Para atualizações urgentes, envie uma solicitação de reanalisação através do Search Console, mas a propagação completa ainda requer a expiração do cache. Nota: o robots.txt apenas orienta rastreadores e não pode forçar a remoção de páginas indexadas.