python - 使用 ijson 读取和解析 JSON

翻译自：https://stackoverflow.com/questions/66048144 2021-02-04T14:57:52.840

33 次

我有一些具有以下结构的大 json 文件：

[
  {
    "url": "",
    "publishedDate": "",
    "modifiedDate": "",
    "title": "",
    "summary": "",
    "content": "",
    "language": "",
    "section": "",
    "tags": [],
    "authors": []
  },
  {
    "url": "",
    "publishedDate": "",
    "modifiedDate": "",
    "title": "",
    "summary": "",
    "content": "",
    "language": "",
    "section": "",
    "tags": [],
    "authors": []
  },
  ...
]

但是用默认的 pythonjson库序列化这个大的 JSON 最终会消耗太多的内存，所以我已经搜索了其他替代方案。其中之一ijson是应该只消耗与文件大小本身相同的内存量。

问题是，我不知道如何使用它（从 java 的角度来看，我是 python 的新手）而且我发现的大多数教程都没有像上面那样解析 json。如何使dictionariesjson 列表中的每个项目的 ijson 产生？

提前致谢。

python - 使用 ijson 读取和解析 JSON

0 回答 0

Related

Reference