我试图下载经济学人的 Github 存储库提供的有关 covid 的数据。
library(readr)
library(knitr)
myfile <- "https://raw.githubusercontent.com/TheEconomist/covid-19-excess-deaths-tracker/master/output-data/excess-deaths/all_weekly_excess_deaths.csv"
test <- read_csv(myfile)
我得到的是一个 tibble 数据框,我无法轻松访问存储在该 tibble 中的数据。我想看一列,说test$covid_deaths_per_100k
并将其重新塑造成矩阵或ts
对象,其中行表示时间,列表示国家。
我手动尝试过,但失败了。然后我尝试使用该tsibble
软件包并再次失败:
tsibble(test[c("covid_deaths_per_100k","country")],index=test$start_date)
Error: Must extract column with a single valid subscript.
x Subscript `var` has the wrong type `date`.
ℹ It must be numeric or character.
所以,我想问题是数据是按国家堆积的,因此时间索引是重复的。我需要一些神奇的管道功能来完成这项工作吗?有没有一种简单的方法可以做到这一点,也许不需要管道?