最近,我不得不抓取大量数据,并从使用提要格式“json”更改为“jsonlines”,以避免将其全部打乱和重复。问题是现在我的程序都没有将导出的文件识别为 JSON,因为它删除了开始和结束方括号以及每个项目后的逗号。第一个例子显示了数据的样子,第二个例子是我想要实现的。
{"name": "Color TV", "price": "1200"}
{"name": "DVD player", "price": "200"}
---------------------------------------
{"data" : [
{"name": "Color TV", "price": "1200"},
{"name": "DVD player", "price": "200"},
{"name": "Color TV", "price": "1200"}
]}
有没有办法在仍然使用 JsonLinesItemExporter 的同时手动添加逗号并使其成为一个数组?
我认为与我的爬虫相关的唯一一段代码是我的 yield 关键字,但我很高兴展示完整的代码。我没有使用 PHP 或 MySQL。
非常感谢您提前。
yield {
"name": name,
"old_price": old_price,
"discount_price": discount_price
}