2

我正在这样做

newzips=fromJSON("http://media.mongodb.org/zips.json")

您可以在http://media.mongodb.org/zips.json自己查看数据

并因此得到

str(newzips)
 List of 5
 $ city : chr "ACMAR"
 $ loc  : num [1:2] -86.5 33.6
 $ pop  : num 6055
 $ state: chr "AL"
 $ _id  : chr "35004\"}{\"city\":\"ADAMSVILLE\",\"loc\":[-86.959727,33.588437],\"pop\":10616,\"state\":\"AL\",\"_
4

2 回答 2

7

这种格式称为jsonlines。您可以使用stream_injsonite 中的函数导入它:

library(jsonlite)
zips <- stream_in(url("http://media.mongodb.org/zips.json"))

如果服务器使用https,可以使用curl包:

library(jsonlite)
library(curl)
zips <- stream_in(curl("https://media.mongodb.org/zips.json"))

每行是一条记录的数据集通常是 nosql 数据库转储。因为它们可能太大而无法一次全部解析,所以它们应该被逐行导入,这正是 jsonlite 所做的。

于 2014-12-07T00:47:55.350 回答
4

readLines + 将其混入一个带有一些括号和逗号分隔的 JS 数组:

> json = fromJSON(paste("[",paste(readLines("http://media.mongodb.org/zips.json"),collapse=","),"]"))
Warning message:
In readLines("http://media.mongodb.org/zips.json") :
  incomplete final line found on 'http://media.mongodb.org/zips.json'
> head(json)
        city                 loc   pop state   _id
1      ACMAR -86.51557, 33.58413  6055    AL 35004
2 ADAMSVILLE -86.95973, 33.58844 10616    AL 35005
3      ADGER -87.16746, 33.43428  3205    AL 35006
4   KEYSTONE -86.81286, 33.23687 14218    AL 35007
5   NEW SITE -85.95109, 32.94145 19942    AL 35010
6     ALPINE -86.20893, 33.33116  3062    AL 35014
于 2014-07-01T16:04:39.030 回答