我们在负载平衡的环境中有一个 Umbraco 站点,我们需要确保只抓取实际的 URL,而不是不同的生产 URL。
我们只想example.com在负载均衡器在production1.example.com和production2.example.com不在时被索引。
我是否将这些 URL 的禁止规则添加到 robots.txt,或者将元nofollow标记添加到头部?还是有另一种方法可以让爬虫不索引负载平衡 URL?
我们在负载平衡的环境中有一个 Umbraco 站点,我们需要确保只抓取实际的 URL,而不是不同的生产 URL。
我们只想example.com在负载均衡器在production1.example.com和production2.example.com不在时被索引。
我是否将这些 URL 的禁止规则添加到 robots.txt,或者将元nofollow标记添加到头部?还是有另一种方法可以让爬虫不索引负载平衡 URL?