我的 URL 结构设置为两个平行(都指向同一个地方):
www.example.com/subname
www.example.com/123
问题是,蜘蛛正在爬进类似的东西:
www.example.com/subname/default_media_function
www.example.com/subname/map_function
请注意,名称“子名称”代表我网站上的数千个不同页面,它们都具有相同的功能。
他们抛出错误,因为这些链接严格用于 JSON 或 AJAX 目的,而不是实际链接。我想阻止他们访问这些页面,但是如果 URL 包含变量,我该怎么做?
这可以在 robots.txt 中使用吗?
Disallow: /map_function