我正在使用 R 中的 mouse 包进行多重插补并试图理解其背后的算法。
在其文档http://www.jstatsoft.org/v45/i03/paper中,据说使用了 MICE 算法。据我了解,它使用 Gibbs Sampler 执行 MCMC,其中模拟参数 BETA,该参数定义了给定 Y-(没有 Y 的所有其他变量)的 Y(具有缺失值的变量)的条件分布。使用模拟的 BETA,定义了相应的条件分布。然后它从条件分布中提取值并用它替换缺失的值。它对所有具有缺失值的变量重复该过程。
但是,我不明白的是,回归发生在哪里?在mice() 函数中,我们确实需要指定'method' 参数。例如,'logreg' 用于二项分布变量,'polyreg' 用于超过 2 级的因子变量。如果插补由 MCMC 完成,为什么我们需要指定回归?
一些文档表明 MICE 算法在所有缺少模式的变量上迭代地运行回归。每次缺失一个变量为被访变量,其余均为解释变量。然后使用拟合值替换缺失值并转到下一个缺失值变量。下一个回归将包括上次回归的估算数据。这与 Gibbs 采样器的方案相同,但似乎没有模拟。详细信息在这里http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3074241/
任何人都可以帮助我了解 R 中老鼠的真实情况吗?