我正在尝试从 CSV 文件中读取 URL,检查它们是否可用,并将错误的 URL 写入另一个文件。我经历了大约几千次,然后急剧减速(从每秒检查 5 次到每 10 秒检查一次),然后得到“FATAL ERROR: CALL_AND_RETRY_2 Allocation failed - process out of memory”,大概是因为我没有申请正确地对发射流进行背压。
var csv = require('csv');
var request = require('request');
var fs = require('fs');
csv()
.from(fs.createReadStream('./urls.csv'), {columns: true})
.to(fs.createWriteStream('./badurls.csv'))
.transform(function(data, index, callback){
checkImage(null,callback,data['main-image-url'],index)
});
function checkImage(err, callback, url, index) {
if (url != "") {
request.head(url, function(err, res) {
console.log(index,res.statusCode,url);
if (res.statusCode != 200) {
callback(null,url+"\n");
}
})
}
}