使用以下形式的数据,我可以通过哪些方式计算 R 编程语言中的(特定年龄的)死亡率?
head(data)
## age gender zone Class misc bonus duration death cost
## 1 0 M 1 4 12 1 0.1753 0 0
## 2 4 M 3 6 9 1 0.0000 1 0
## 3 5 F 3 3 18 1 0.4548 0 0
## 4 5 F 4 1 25 1 0.1726 0 0
## 5 6 F 2 1 26 1 0.1808 0 0
## 6 9 F 3 3 8 1 0.5425 0 0
也就是说,对于每个年龄,我想计算死亡人数并除以该特定年龄的暴露个体总数。我尝试了以下方法:
n <- length(data$age);
rate <- c(1:n);
for (i in 1:n){
rate[i] <- sum(subset(data, age == i)$death)/ length(subset(data, age == i))
}
但这是没用的——显然数据集中并非所有年龄从 1 到 n 都存在——我正在寻找一个上述意义上的书面程序来完成这项工作。