3

我正在尝试从 CSV 文件中读取 URL,检查它们是否可用,并将错误的 URL 写入另一个文件。我经历了大约几千次,然后急剧减速(从每秒检查 5 次到每 10 秒检查一次),然后得到“FATAL ERROR: CALL_AND_RETRY_2 Allocation failed - process out of memory”,大概是因为我没有申请正确地对发射流进行背压。

var csv = require('csv');
var request = require('request');
var fs = require('fs');

csv()
.from(fs.createReadStream('./urls.csv'), {columns: true})
.to(fs.createWriteStream('./badurls.csv'))
.transform(function(data, index, callback){
  checkImage(null,callback,data['main-image-url'],index)
});

function checkImage(err, callback, url, index) {
  if (url != "") {
    request.head(url, function(err, res) {
      console.log(index,res.statusCode,url);
      if (res.statusCode != 200) {
        callback(null,url+"\n");
      }
    })
  }
}
4

0 回答 0