我在 excel 文件中有很多旧的不整洁的数据(50 张,每张 400-500 行)。我的部分数据如下所示:
Elements= c("Project name ONE","John","Smith","Sara","Project name TWO","stardust","soil","sunflower","juice","doe","tobacco", "Project name THREE","phi","rho","omega")
Units= c("NA", "3", "5", "6", "NA", "21", "19", "31", "24", "1", "5", "NA", "21", "21", "22")
df= data.frame(Elements, Units)
在我的大型数据集中,每个项目的行数都非常不同。
我想创建新列“组”,其中定义了每个项目的每一行。对于上述示例,结果将是这样的
Group =c(1,1,1,1,2,2,2,2,2,2,2,3,3,3,3)
df =c(Elements, Units, Group)
但我也想将每个“空”单元格下方的所有值的“单位”列中的值相加到一个新的“总和”列中。
Sum= c("14", "NA", "NA", "NA", "101", "NA", "NA", "NA", "NA", "NA", "NA", "9", "NA", "NA", "NA")
我的最终产品将如下所示:
df =c(Elements, Units, Group, Sum)