4

我有一些数据显示一长串地区,每个地区的人口以及每个地区患有某种疾病的人数。我试图显示每个比例的置信区间(但我没有测试比例是否在统计上不同)。

一种方法是手动计算标准误差和置信区间,但我想使用像 prop.test 这样的内置工具,因为它有一些有用的选项。但是,当我将 prop.test 与向量一起使用时,它会对所有比例进行卡方检验。

我已经用一个while循环解决了这个问题(见下面的虚拟数据),但我觉得必须有一种更好、更简单的方法来解决这个问题。将在这里申请工作,以及如何?谢谢!

dat <- data.frame(1:5, c(10, 50, 20, 30, 35))
names(dat) <- c("X", "N")
dat$Prop <- dat$X / dat$N

ConfLower = 0
x = 1
while (x < 6) {
    a <- prop.test(dat$X[x], dat$N[x])$conf.int[1]
    ConfLower <- c(ConfLower, a)
    x <- x + 1
}

ConfUpper = 0
x = 1
while (x < 6) {
    a <- prop.test(dat$X[x], dat$N[x])$conf.int[2]
    ConfUpper <- c(ConfUpper, a)
    x <- x + 1
}

dat$ConfLower <- ConfLower[2:6]
dat$ConfUpper <- ConfUpper[2:6] 
4

1 回答 1

4

这是使用 的尝试Map,基本上是从以前的答案中窃取的:
https ://stackoverflow.com/a/15059327/496803

res <- Map(prop.test,dat$X,dat$N)
dat[c("lower","upper")] <- t(sapply(res,"[[","conf.int"))

#  X  N      Prop       lower     upper
#1 1 10 0.1000000 0.005242302 0.4588460
#2 2 50 0.0400000 0.006958623 0.1485882
#3 3 20 0.1500000 0.039566272 0.3886251
#4 4 30 0.1333333 0.043597084 0.3164238
#5 5 35 0.1428571 0.053814457 0.3104216
于 2013-12-16T01:01:51.790 回答