我有使用或未使用药物“X”的患者的蛋白质“F”数据。我有 3 个共同创始人(年龄、BMI、性别)需要调整。
我使用以下代码成功计算了药物组和无药物组中蛋白质含量的平均值:
> F <- data$f
> by(F, drugnodrug, summary)
> summ(F, by=drugnodrug)
现在,我想计算绝对均值差(95% 置信区间)。
我怎样才能在 R(dplyr 包)中做到这一点?我可以使用多元线性回归进行此计算吗?如何?
我有使用或未使用药物“X”的患者的蛋白质“F”数据。我有 3 个共同创始人(年龄、BMI、性别)需要调整。
我使用以下代码成功计算了药物组和无药物组中蛋白质含量的平均值:
> F <- data$f
> by(F, drugnodrug, summary)
> summ(F, by=drugnodrug)
现在,我想计算绝对均值差(95% 置信区间)。
我怎样才能在 R(dplyr 包)中做到这一点?我可以使用多元线性回归进行此计算吗?如何?
这可以使用基数 R 来完成,因为t.test
它还报告了平均差的置信区间:
> res <- t.test(iris$Sepal.Length[iris$Species=="setosa"],
+ iris$Sepal.Length[iris$Species=="virginica"])
> res$conf.int
[1] -1.78676 -1.37724
attr(,"conf.level")
[1] 0.95
平均值存储在入口估计中,您可以使用
> res$estimate[1] - res$estimate[2]
mean of x
-1.582
或等效地
> sum(res$estimate * c(1,-1))
[1] -1.582