新西兰公司注册提供了一个 json 文件,其中包含所有公开的商业信息。该文件高达 40gb,但还有一个较小的 json 文件(约 250mb),其中包含非法人实体(个体经营者等)的数据。作为一个热身练习,我想我应该将它导入 R 以了解大小、可伸缩性和计算需求。
我在将较小的 json 文件导入 R 时遇到了很多麻烦。我尝试过 jsonlite、RJSONIO、rjson,但似乎该文件是以“非正统”json 格式编写的,因此标准的“fromJSON”命令正在失败. 以下是我一直试图导入 R 的文件的一部分(2 个实体):test.json
library(jsonlite)
json <- fromJSON("test.json", flatten=TRUE)
Error in parse_con(txt, bigint_as_char) :
parse error: invalid object key (must be a string)
zbn": [{ "entity": [{ { "australianBusinessNumbe
(right here) ------^
注意:JSONlint 似乎不认为该文件是有效的 JSON 文件
我的想法是我可能需要使用 stream_in() 或 readLines() 但我对这些功能不是很精通。非常感谢任何帮助或见解。干杯