我有一个连接到 AWS lambda 的 API,它执行以下操作:
- 从 s3 获取 JSON 数据。记录数约 60,000
- 使用 Json2csv 库将 JSON 数据解析为 csv 字符串
- 将 csv 字符串结果放入 s3 存储桶
上面的第 2 点将 JSON 数据解析为 csv 字符串需要很长时间。我使用的库是 json2csv:https ://www.npmjs.com/package/json2csv
以下是我的代码:
/// Get data in JSON format in object: records (array of JSON)
let headers = [
{
label: "Id",
value: "id"
},
{
label: "Person Type",
value: "type"
},
{
label: "Person Name",
value: "name"
}
];
let json2csvParser = new Parser({ fields: headers });
console.log("Parsing started");
let dataInCsv = json2csvParser.parse(records);
console.log("Parsing completed");
// PutObject of dataInCsv in s3
解析 60K 条记录大约需要 20 秒。我能做些什么来提高这里的性能吗?还有别的图书馆吗?我曾经认为在内存中操作非常快。为什么这个解析很慢。请提供任何帮助。