大多数情况下,我在谷歌上找到了我的问题的答案,但现在我被困住了。我正在研究一个刮板脚本,它首先刮掉网站的一些用户名,然后获取用户的每一个细节。涉及到两个爬虫,第一个通过主页,获取名字,然后获取其个人资料页面的详细信息,然后前进到下一页......我正在抓取的第一个站点总共有64个名字,显示在一个主页上,而第二个页面有4个页面,显示超过365个名字。
第一个效果很好,但是第二个不断让我收到 500 内部错误。我试图限制脚本,只抓取几个名字,这就像魅力一样,所以我更确定脚本本身没问题!我的 php ini 文件中的 max_execution_time 设置为 1500,所以我想这也不是问题,但是有一些原因导致错误......例如,不确定在每 10 个名称之后添加一个睡眠命令是否可以解决我的情况,但是好吧,我现在正在尝试!
因此,如果你们中的任何人知道什么可以帮助解决这种情况,我将不胜感激!
在此先感谢,z