我希望抓取我网站的一个页面,而不是其他页面。
另外,如果它与上面的答案有任何不同,我还想知道除了网站的根(索引)之外禁止所有内容的语法。
# robots.txt for http://example.com/
User-agent: *
Disallow: /style-guide
Disallow: /splash
Disallow: /etc
Disallow: /etc
Disallow: /etc
Disallow: /etc
Disallow: /etc
或者我可以这样做吗?
# robots.txt for http://example.com/
User-agent: *
Disallow: /
Allow: /under-construction
另外我应该提到这是一个 WordPress 安装,因此例如“正在建设中”被设置为首页。因此,在这种情况下,它充当索引。
我想我需要的是http://example.com
craweld,但没有其他页面。
# robots.txt for http://example.com/
User-agent: *
Disallow: /*
这是否意味着在 root 之后不允许任何内容?