1

我不确定是否需要为此提供可重现的输出,因为这是一个更普遍的问题。无论如何,在运行 mouse 包后,它会返回m多个估算数据集。我们可以使用complete()函数提取数据。

但是,我很困惑我应该使用哪个数据集进行后续分析(描述性估计、模型构建等)。

问题: 1. 我是否需要提取特定的数据集,例如complete(imp,1)?或者我应该使用整个估算数据集,例如complete(imp, "long", inc = TRUE)

  1. 如果是后者complete(imp, "long", inc = TRUE),我如何计算一些描述,如均值、比例等?例如,我将使用 SPSS 分析长数据。我应该根据m估算数据集的数量拆分数据并手动找到平均值吗?那应该怎么做?

谢谢你的帮助。

4

2 回答 2

3

您应该对每个估算的数据集单独运行统计分析m,然后将结果汇总在一起。这允许您考虑由插补程序引入的额外不确定性。MICE 内置了这个功能。例如,如果你想做一个简单的线性模型,你可以这样做:

fit <- with(imp, lm(y ~ x1 + x2))
est <- pool(fit)
summary(est)

签出?pool?mira

于 2017-03-12T09:29:54.820 回答
0

多重插补包括以下三个步骤:

1. Imputation
2. Analysis
3. Pooling

第一步,m生成估算数据集的数量,第二步数据分析,例如回归分别应用于每个数据集。最后,在第三步中,将分析结果汇总为最终结果。针对不同的参数实现了各种池化技术。这是一个很好的链接,详细描述了池 -老鼠小插曲

于 2017-03-12T18:42:35.140 回答