1

这是我最近第二次遇到这个问题,所以我想看看是否有更好的方法来解析从jsonlite其中一个元素是作为列表存储为数据帧中的列的数组返回的数据帧。

我知道这部分的力量与jsonlite,但我不确定如何使用这种嵌套结构。最后,我想我可以编写自己的自定义解析,但鉴于我快到了,我想看看如何处理这些数据。

例如:

## options
options(stringsAsFactors=F)

## packages
library(httr)
library(jsonlite)

## setup
gameid="2015020759"
SEASON = '20152016'
BASE = "http://live.nhl.com/GameData/"
URL = paste0(BASE, SEASON, "/", gameid, "/PlayByPlay.json")

## get the data
x <- GET(URL)

## parse
api_response <- content(x, as="text")
api_response <- jsonlite::fromJSON(api_response, flatten=TRUE)

## get the data of interest
pbp <- api_response$data$game$plays$play
colnames(pbp)

并探索返回的内容:

> class(pbp$aoi)
[1] "list"
> class(pbp$desc)
[1] "character"
> class(pbp$xcoord)
[1] "integer"

从上面看,该列pbp$aoi是一个列表。以下是一些条目:

> head(pbp$aoi)
[[1]]
[1] 8465009 8470638 8471695 8473419 8475792 8475902

[[2]]
[1] 8470626 8471276 8471695 8476525 8476792 8477956

[[3]]
[1] 8469619 8471695 8473492 8474625 8475727 8476525

[[4]]
[1] 8469619 8471695 8473492 8474625 8475727 8476525

[[5]]
[1] 8469619 8471695 8473492 8474625 8475727 8476525

[[6]]
[1] 8469619 8471695 8473492 8474625 8475727 8475902

我真的不在乎我是否在同一个数据框中解析这些列表,但是我有什么可以解析数据的选项?

我更愿意将数据从列表中取出,并将它们解析成一个数据框,该数据框可以与它来自的原始记录“相关”。

在此先感谢您的帮助。

4

1 回答 1

2

从上面的@hrbmstr,我能够使用unnest.

select(pbp, eventid, aoi) %>% unnest() %>% head
于 2016-02-08T23:05:05.280 回答