0

新西兰公司注册提供了一个 json 文件,其中包含所有公开的商业信息。该文件高达 40gb,但还有一个较小的 json 文件(约 250mb),其中包含非法人实体(个体经营者等)的数据。作为一个热身练习,我想我应该将它导入 R 以了解大小、可伸缩性和计算需求。

我在将较小的 json 文件导入 R 时遇到了很多麻烦。我尝试过 jsonlite、RJSONIO、rjson,但似乎该文件是以“非正统”json 格式编写的,因此标准的“fromJSON”命令正在失败. 以下是我一直试图导入 R 的文件的一部分(2 个实体):test.json

library(jsonlite)
json <- fromJSON("test.json", flatten=TRUE)

Error in parse_con(txt, bigint_as_char) : 
   parse error: invalid object key (must be a string)
      zbn": [{          "entity": [{            {               "australianBusinessNumbe
                 (right here) ------^

注意:JSONlint 似乎不认为该文件是有效的 JSON 文件

我的想法是我可能需要使用 stream_in() 或 readLines() 但我对这些功能不是很精通。非常感谢任何帮助或见解。干杯

4

0 回答 0