我正在尝试从相当分散的数据(例如 5 年组中的年龄变量)中分割人口普查数据,并根据聚合创建汇总变量(例如每个县 18 岁以上的所有男性)。我的解决方案是 rowSums,例如county$MalesOver18 <- rowSums(county[,c(68:87)])
,其中 vars 68-87 与 18 岁以上的男性相加——效果很好。但是,对于 500 个变量,计算我的开始/结束列的顺序并不高效。
但是当我使用我的首选解决方案时,rowSums 的列名(例如rowSums(county[,c(H76007:H76025)]
,其中 H vars = 字段名),我得到 2 个 msg 错误之一:
在引号中运行 w/ col 名称: Error in "H76007":"H76025" : NA/NaN argument
In addition: Warning messages:
1: In
[.data.frame (county, , c("H76007":"H76025")) :
NAs introduced by coercion
2: In
[.data.frame(county, , c("H76007":"H76025")) :
NAs introduced by coercion
运行 w/ col 名称而不是引号:Error in
[.data.frame(county, , c(H76007:H76025)) :
object 'H76007' not found
我尝试使用 na.rm 命令并将我的变量设置为数字——尽管它们已经是整数——但都没有结果。
有什么指导吗?谢谢。