我有一些具有以下结构的大 json 文件:
[
{
"url": "",
"publishedDate": "",
"modifiedDate": "",
"title": "",
"summary": "",
"content": "",
"language": "",
"section": "",
"tags": [],
"authors": []
},
{
"url": "",
"publishedDate": "",
"modifiedDate": "",
"title": "",
"summary": "",
"content": "",
"language": "",
"section": "",
"tags": [],
"authors": []
},
...
]
但是用默认的 pythonjson
库序列化这个大的 JSON 最终会消耗太多的内存,所以我已经搜索了其他替代方案。其中之一ijson
是应该只消耗与文件大小本身相同的内存量。
问题是,我不知道如何使用它(从 java 的角度来看,我是 python 的新手)而且我发现的大多数教程都没有像上面那样解析 json。如何使dictionaries
json 列表中的每个项目的 ijson 产生?
提前致谢。