我们在负载平衡的环境中有一个 Umbraco 站点,我们需要确保只抓取实际的 URL,而不是不同的生产 URL。
我们只想example.com
在负载均衡器在production1.example.com
和production2.example.com
不在时被索引。
我是否将这些 URL 的禁止规则添加到 robots.txt,或者将元nofollow
标记添加到头部?还是有另一种方法可以让爬虫不索引负载平衡 URL?
我们在负载平衡的环境中有一个 Umbraco 站点,我们需要确保只抓取实际的 URL,而不是不同的生产 URL。
我们只想example.com
在负载均衡器在production1.example.com
和production2.example.com
不在时被索引。
我是否将这些 URL 的禁止规则添加到 robots.txt,或者将元nofollow
标记添加到头部?还是有另一种方法可以让爬虫不索引负载平衡 URL?