由于流量在 24 小时内分布不均,我想在偷窥时间禁止爬虫,并在非繁忙时间允许它们。
有没有办法做到这一点?
编辑:感谢所有好的建议。
这是我们找到的另一个解决方案。
2bits.com 有一篇关于设置 IPTables 防火墙以限制来自某些 IP 地址的连接数的文章。
IPTables的设置:
- 使用 connlimit
在较新的 Linux 内核中,有一个用于 iptables 的 connlimit 模块。它可以这样使用:
iptables -I INPUT -p tcp -m connlimit --connlimit-above 5 -j REJECT
这将来自每个 IP 地址的连接限制为不超过 5 个同时连接。这种“口粮”连接,并防止爬虫同时访问该站点。*