0

我有几个问题,除非我遗漏了某些内容或不了解估算过程/逻辑,否则我无法真正找到有关文档的任何内容。

基本上最重要的是,由于有时“估算”值不同,我想取平均值 - 如果它是数字 - 或者如果它是分类值则取模式。

我看到的所有示例都显示“完整(miced_model,1)”。如果我用 5 或 10 次不同的迭代运行小鼠模型,我看不出只选择 1 的意义。我想要所有这些的平均值。

谁能告诉我如何做到这一点?

set.seed(2016)
library(mice)
nhanes # this is the dataset
nhanes[5,1]=NA  # setting up some categorical examples
nhanes[1,1]=NA
nhanes$age = as.factor(nhanes$age)
imputed_values = mice(nhanes, m = 5, method='rf',maxit = 3)
new_nhanes = complete(imputed_values, 'long') # or repeated? or what?

new_hanes_fixed =   # new data frame with averaged values imputed rather than just arbitrary '1st' iteration?

谢谢!!

4

2 回答 2

0

听起来您想汇总分析结果,这样您就可以对每个估算的数据集运行分析。在此处阅读有关池数据的更多信息: https ://www.r-bloggers.com/imputing-missing-data-with-r-mice-package/

于 2017-07-14T18:21:03.467 回答
0

你应该看看 SimonG 的评论

你完全走错了路。多重插补的全部意义在于您有不同的插补数据集。(您将在其上执行分析)

如果您不需要多重插补,您可以直接使用单一插补方法。(例如 VIM 包中的 kNN 或 imri 函数)

于 2017-04-18T23:30:37.670 回答