爬虫访问规则配置

默认访问策略 (适用于所有未单独设置的爬虫)

单独配置主流搜索引擎爬虫

Baiduspider (百度)

Googlebot (谷歌)

Bingbot (必应)

Sogou (搜狗)

360Spider (360)

YisouSpider (神马)

YandexBot (Yandex)

Bytespider (头条)

限制访问的目录 (Disallow) - 每行填写一个，例如: /admin/

允许访问的目录 (Allow) - 每行填写一个，例如: /public/

抓取延迟 Crawl-delay (可选，单位：秒)

Sitemap 网站地图地址 (可选)

生成的 robots.txt 内容

User-agent: 定义该规则适用于哪个搜索引擎爬虫。* 代表所有爬虫。
Disallow: 告诉爬虫禁止抓取指定的目录或文件。例如 Disallow: /admin/ 表示禁止抓取 admin 目录下的所有内容。
Allow: 告诉爬虫允许抓取的目录。通常与 Disallow 配合使用，用于在被限制的大目录中“开特例”允许抓取某个子目录。
Crawl-delay: 限制爬虫抓取的时间间隔（秒），防止爬虫过快抓取导致服务器宕机（注：部分搜索引擎如 Google 现已不再严格遵守该指令，转而在其站长平台中配置）。
Sitemap: 告诉爬虫网站的 Sitemap XML 文件地址，帮助搜索引擎更高效地发现网站所有链接。