我正在使用 API 对网站进行全面爬网,我得到了很多:
{“errorType”:“ServerErrorException”,“error”:“ServerErrorException:服务器错误。(HTTP 500)”}
我也收到超时响应并且实际的 http 失败:StatusCode: 504, ReasonPhrase: 'GATEWAY_TIMEOUT'
我正在浏览我正在同时抓取的网站,它似乎仍然快速且响应迅速,没有减速。
我从我的代码中删除了多线程并同步运行,这会停止 500 个错误,但它仍然会产生很多超时(并且需要很长时间)。
我的多线程运行的并发连接少于 100 个。是不是太多了?我想把它推到1000+。我需要在请求之间添加一些延迟吗?