我的基本目标是对数据集进行子集化,并使用使用 lag 函数的新列进行汇总。我了解如何对数据集进行子集化,但是我很难在我的数据集中使用滞后函数来完成,这给我带来了麻烦。
我已经尝试了几种不同的方法来实现它,但都没有成功。
gapminder %>%
na.omit() %>%
group_by(country) %>%
summarise(prevPeriod = lag(year),
lifeExpGrowth = lag(lifeExp),
popGrowth = lag(pop),
gdppcGrowth = 100*(gdpPercap/lag(gdpPercap) - 1)))
我目前正在让我的代码根据国家/地区而不是年份运行滞后。gdppcGrowth 也应该返回一个百分比,我得到一个错误;
Column `gdppcGrowth` must be length 1 (a summary value), not 12
对于每个函数,我想按国家分析数据,重点是增长率。我想使用 lag(x) 函数来访问系列或向量的前一个值,以便 100*(x/lag(x) - 1) 计算以百分比表示的 x 的标准(算术)增长率。