我正在编写一个 node.js 应用程序,它需要从提供者的页面列表中获取一些数据:
var list = [
{ url: 'http://www.example.com/1' },
{ url: 'http://www.example.com/2' },
...
{ url: 'http://www.example.com/N' },
];
目前我正在使用async.each,效果很好:
async.each(
list, // 1st param is the array of items
function(elem, callback) { // 2nd param is the function that each item is passed to
request(elem.url, function (error, response, body) {
if (!error && response.statusCode == 200) {
console.log(body);
}
}),
},
function(err) { // 3rd param is the function to call when everything's done
if (err) {
console.error('Error in the final async callback:', err);
}
}
);
唯一的问题是站点的服务器有时(可以理解)响应403(禁止)状态代码,因为在时间单位内来自同一 IP 的请求过多......
我看到也async
提供了一种whilst()
方法,其示例是:
var count = 0;
async.whilst(
function () { return count < 5; },
function (callback) {
count++;
setTimeout(callback, 1000);
},
function (err) {
// 5 seconds have passed
}
);
但是我看不到如何将它与列表一起使用,或者如何将它与async.each
...结合使用 :-(
所以答案是:如何限制(限制)node.js 中的异步请求列表?
PS:为了更清楚,我不希望(如果可能)将请求排队,因为请求可能需要很长时间才能完成......:我只想在定义的时间间隔(比如 5 〜每个请求之间的10秒......)。
更新:
在 alireza david 发表评论后,我确实尝试使用 async.eachLimit,这对我来说看起来很有希望......这是它的用法示例,在模块 github站点上:
async.eachLimit(
obj.files,
limit
function (file, complete) {
complete();
},
function (err) {
}
);
但是限制使用没有记录,我也不清楚......如果有人有任何线索......