0

我正在使用 csvparser 解析一个巨大的 csv (1.2GB) 并尝试从解析的 csv 中获取某些列数据。我试图在处理后将数据推送到数组,但只得到空数组作为输出。如何修复此代码?

var parse = require('csv-parse');

var output = []
var parser = parse({
   delimiter: '\t',
   columns: true
}, function(err, csvLine) {
   for (var l = 0; l < csvLine.length; l++) {
      output.push(csvLine[l].id)
   }
});

console.log(output)

fs.createReadStream('file.csv', {
   encoding: 'utf8'
}).pipe(parser);

at 的输出console.log(output)始终是一个空数组。请帮我解决这个问题。

我试图理解这里的帖子 - Save csv-parse output to a variable。但我无法理解和修复代码。

4

2 回答 2

2

因为异步。console.log(output)在解析器变量声明之后运行。那时输出变量中没有值。

当所有数据从 csv 读取时,您必须在循环后访问输出变量,如下所示。

    var parse = require('csv-parse');
    var fs = require('fs');
    var output = []
    var parser = parse({
       delimiter: ',',
       columns: true
    }, function(err, csvLine) {
       for (var l = 0; l < csvLine.length; l++) {
          output.push(csvLine[l].visitortype)
       }
       console.log(output)
    }); 
    fs.createReadStream('file.csv', {
       encoding: 'utf8'
    }).pipe(parser);
于 2019-02-02T10:24:07.823 回答
0

用于fast-csv将文件解析为ReadableStream,然后使用异步迭代(for await)逐行处理。它更简单。

const csv = require("fast-csv")

let myList=[];

const csvStream = csv.fromPath(filename);
for await(const row of csvStream) {
    myList.push(row[1]); // get the second column
}
于 2019-03-28T15:14:59.823 回答