1

我对 R 比较陌生,所以如果我没有使用正确的术语来描述我的问题,我深表歉意。

我经常一起使用“group_by”和“mutate”(来自 dplyr 包),以便将新变量添加到我的数据框。例如,我使用下面的代码来计算按州(“fips”)和年份(“year”)分组的县人口总和。

 county <- county %>% group_by(fips, year) %>% mutate(pop.sum = sum(pop, na.rm=TRUE))

但是,每当我这样做时,它都会创建我认为是一个名为“组”的属性:

在此处输入图像描述

我不确定这是什么,或者为什么它有这么长的行列表。我已经能够通过运行“删除”这个属性:

 attr(county, "groups") <- NULL

但这最终会导致其他问题。例如,如果我在删除“组”属性后尝试合并此数据框,我将收到以下错误:

Error: `.data` is a corrupt grouped_df, the `"groups"` attribute must be a data frame

谁能解释这个“组”属性是什么?另外,当我使用创建此属性的“group_by”和“mutate”时,我做错了什么吗?

谢谢!

4

0 回答 0