我在某个特定网站上运行我的爬虫www.example.com
。爬虫在大约 100 个条目后被 CAPTCHA 阻止。另一方面,当我进入谷歌并搜索时,site:www.example.com
我找到了 100,000 个结果,并且结果被谷歌正确缓存。
我的问题:为什么 Google bot 没有被阻止而我却被阻止了?是因为谷歌使用了数千个不同的 IP 还是有其他技巧?
我在某个特定网站上运行我的爬虫www.example.com
。爬虫在大约 100 个条目后被 CAPTCHA 阻止。另一方面,当我进入谷歌并搜索时,site:www.example.com
我找到了 100,000 个结果,并且结果被谷歌正确缓存。
我的问题:为什么 Google bot 没有被阻止而我却被阻止了?是因为谷歌使用了数千个不同的 IP 还是有其他技巧?