在异步瀑布的第二个函数中,我代码中的eachSeries
回调 ( urlCallback
) 在瀑布回调 ( waterfallCallback
) 之后执行,原因我无法确定。
async.waterfall([
function(callback) {
request(website, function (error, response, html) {
if (!error && response.statusCode == 200) {
pageUrls = getPageUrls(html)
callback(null, pageUrls)
}
})
},
function (pageUrls, waterfallCallback) {
async.eachSeries(pageUrls, function (url, urlCallback) {
console.log('SET ' + url)
request(url, function (err, response, body) {
var $ = cheerio.load(body)
$('#div').children().each(function(){
console.log($(this).children("a").attr("href"));
itemUrl = $(this).children("a").attr("href")
itemUrls.push(itemUrl)
})
urlCallback(null,itemUrls)
})
},
waterfallCallback(null, itemUrls))
}
],
function(err, results) {
console.log("results: " + results)
})
AFAIK, async.eachSeries 接受三个参数(数组,functionToBeExecuteOnEachItem,回调)并按顺序执行它们。不知何故不在这里。