这是存储库的 github stats api 数据的结构。我正在使用 dplyr 和 tidy_json 库来列出存储库中每个用户的提交数(“c”)、删除(“d”)、添加的代码行数(“a”)和相应的周数(“w”) .
{
"total": 5,
"weeks": [
{
"w": 1428192000,
"a": 0,
"d": 0,
"c": 0
},
{
"w": 1428796800,
"a": 0,
"d": 0,
"c": 0
}
],
"author": {
"login": "ttuser1234",
"id": 111111111
}
},
{
"total": 18,
"weeks": [
{
"w": 1428192000,
"a": 212,
"d": 79,
"c": 5
},
{
"w": 1428796800,
"a": 146,
"d": 67,
"c": 1
}
],
"author": {
"login": "coder1234",
"id": 22222222
}
}
}
我可以分别提取周数和作者数据,但无法将它们连接在一起。
inp_file=read_json("The JSON file")
dat=as.tbl_json(inp_file)
dat%>%
enter_object("weeks") %>%
gather_array %>%
spread_values(week=jstring("w"),add=jstring("a"),del=jstring("d"),comm=jstring("c"))
enter_object("author") %>%
spread_values(handle=jstring("login"))
在任何时候我都无法从作者对象跳转到周对象来链接它们中的 2 个。有什么办法可以做到这一点吗?感谢任何帮助。