我使用 PHP(和 cURL)制作了一个简单的网络爬虫。它解析大约 60 000 个 html 页面并检索产品信息(它是 Intranet 上的一个工具)。
我主要关心的是并发连接。我想限制连接数,所以无论发生什么,爬虫都不会使用超过 15 个并发连接。
每当 IP 达到 25 个并发连接的限制时,服务器都会阻止 IP,由于某种原因,我无法在服务器端更改它,所以我必须找到一种方法让我的脚本永远不会使用超过 X 个并发连接.
这可能吗?
或者也许我应该用另一种语言重写整个事情?
谢谢,任何帮助表示赞赏!