问题标签 [r-mice]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3978 浏览

r - 绘制多重插补结果

我已经使用 R 中的 MICE 包成功完成了对问卷研究缺失数据的多重插补,并对汇总的插补变量进行了线性回归。我似乎无法弄清楚如何提取单个汇集变量并在图表中绘图。有任何想法吗?

例如

我想通过 TMAS 绘制汇集的 APE。

使用 nhanes 的可重现示例:

我想针对池化 bmi 绘制池化 chl(例如)。

我能做到的最好的是

我相信这给出了所有 5 个插补的组合图,并不是我想要的(我认为)。

0 投票
1 回答
360 浏览

r - 来自`mids`对象的ggplot中的条形图

尽管已经使用了 ggplot 几次,但我真的很难在这个问题上取得任何进展。我想如果不尝试使用 ggplot 的可恶尝试,最容易解释我想要做什么,以下内容也很丑陋,但这是我目前能做到的最好的:(

我想创建一个漂亮的图表网格,在 ggplot 中显示这些条形图 - 例如,1 行 6,在 y 轴上都具有相同的比例,以便可以轻松比较它们。

我想我应该使用ldt <-complete(impute,"long", include=TRUE)thenmelt(ldt, c(".imp",".id","hyp"))但我就是不知道在那之后如何调用 ggplot :(

请注意,我的真实数据中有许多不同的变量,这仅适用于分类变量。我在想我可以制作一个函数,然后使用sapply,但只能在分类列上运行?但我不知道该怎么做!

0 投票
1 回答
271 浏览

r - 没有刻面的ggplot

以下代码来自@ROLO 对我之前的问题的回答,生成了 3 个图:

在此处输入图像描述

我的问题是,如何修改它以单独绘制每个?

0 投票
1 回答
4020 浏览

r - 使用 MICE 包进行多次插补后合并 Cox PH 结果

我有一个包含生存数据和一些缺失协变量的数据集。我已经成功地应用了mice-package来使用该mice()函数来估算m个数据集,创建了一个imputationList对象并在每个m数据集上应用了一个Cox PH模型。随后,我使用该函数汇总了结果MIcombine()。这导致了我的问题:

如何获得每个协变量的汇总估计值的 p 值?它们是否隐藏在MIcombine物体内的某个地方?

我知道 p 值并不是一切,但是在没有相应 p 值的情况下报告估计值和置信区间对我来说似乎很奇怪。我可以计算一个近似值。使用例如Altman 提供的公式从置信区间中获取 p 值,但这似乎过于复杂。我已经四处寻找答案,但我什至找不到任何人提到这个问题。我是否忽略了一些明显的东西?

例如:

我试图对 MIcombine 对象的结构进行排序,但到目前为止还没有找到 p 值。

0 投票
1 回答
1674 浏览

r - 在 R 中使用 MICE 时内存不足

我正在尝试使用 MICE 包在 R 中创建多个插补,但 kepp 内存不足。这是我收到的错误消息:

我使用 64 位 R 和 windows 7 和 8 Gb 内存。我已经尝试增加实际内存,并且允许内存大小 R 分别使用 8 Gb 和 6.5 Gb,但它仍然不起作用。目前,我正在尝试对包含 27 000 行和 17 列的数据集进行插补,但我希望在具有 1 600 000 行和 17 列的更大数据上使用。

有人能帮我吗?将深深感激。

/杰斯珀

0 投票
1 回答
3668 浏览

r - R中的鼠标问题:无法将“mids”类强制转换为data.frame

我有一个包含大约 11,500 行和 15 个因子的数据集。我只需要估算其中 3 个因子的值,其中只有 2 个因子具有大量缺失值。我一直在尝试使用鼠标来创建估算数据集,并且我正在使用以下代码:

在此代码之后,我收到错误消息:

as.data.frame.default(data) 中的错误:无法将“mids”类强制转换为 data.frame

我完全不知道这意味着什么。只需删除丢失的数据并使用常规 glm,我就可以轻松进行相同的分析。我还想使用 lmer 对估算数据集做一个多级逻辑模型(这是我使用 glm 后的下一步),所以如果我做错了什么也会影响下一步,那将也很高兴知道。我试图在互联网上搜索此错误,但我无处可去。我只是真的在学习 R,所以我对环境还不太熟悉。

谢谢你的时间!

0 投票
1 回答
510 浏览

r - R 的多个实例产生与 MICE 相同的插补 - 随机种子问题?

多重插补包mice使用可以使用set.seed参数设置的随机数生成器。我正在运行 R 的多个实例(即 3 个),其中相同的数据使用相同的mice参数进行估算,set.seed=NA其中没有指定任何种子值。

然而,R 的三个实例产生完全相同的插补。我对这个观察感到困惑,因为我认为 R 的不同实例在使用时应该使用不同的种子值set.seed=NA,但看起来它们使用的是相同的。当我set.seed手动设置时,会产生不同的插补。

我的问题是:这是否合理,或者是否存在导致种子相同的计算机(PC windows 7)问题,即使我设置了set.seed=NA. 我欢迎任何关于这个问题的想法。

顺便说一句:我使用 R 的多个实例,因为 MICE 函数ibind()可用于组合mids(乘以估算数据集)对象。因此,它可以节省多核系统的计算时间。如果产生相同的插补,这当然是无稽之谈。

0 投票
1 回答
6187 浏览

r - MICE 中的“前导次要 % 不是正确定的”错误

mice在使用大量数据(30 个分类预测变量和预测变量,
n = 1000)在 R 中运行时,我收到以下错误:

错误chol.default(fit.sum$cov.unscaled):17阶的前导小调不是正定的

polyreg对大多数变量使用(多项回归)作为插补方法。由于我不知道为什么会发生此错误,因此我无法发布更多可以重现它的代码。

在 MICE 中使用线性回归时,我在这里发现了一个类似问题的帖子。这篇文章在 Cross Validated 上没有收到任何答案。

如本文所述,这也可能与吉布斯抽样中必要的某些程序有关。OP 在自编程函数中使用 描述了此错误MCMC,这与 MICE 使用的程序有关。

我不知道什么是领先的未成年人——如果有人能告诉我,也许那将是一个开始。

0 投票
4 回答
10803 浏览

r - R 中的插补 MICE 仍留在数据集中

运行 MICE 包后,在 5 个完整的插补集中,缺失值的数量从 147428 减少到 46093。但是它不应该是0 NA吗???

谢谢!

这是我的 MICE 代码:

0 投票
2 回答
2639 浏览

r - 结合来自多个插补数据的 ROC 估计

我使用了以下 R 包:micemitoolspROC.

基本设计:在 n~1,000 上缺失数据率介于 5% 和 70% 之间的 3 个预测指标。1 个二元目标结果变量。

分析目标:确定 3 个预测变量中的每一个的 AUROC。

我用这个mice包来估算数据,现在有m个估算数据的数据集。使用以下命令,我可以获得m个数据集的每一个的 AUROC 曲线:

我可以毫无问题地看到每个m个数据集的估计值。

为了组合参数,我尝试使用 mitools

我收到以下错误消息: "Error in pool(fit): Object has no vcov() method"

当组合来自m个数据集的系数估计时,我的理解是这是系数的简单平均值。但是,误差项更复杂。

我的问题:如何合并“m”ROC 参数估计值(AUROC 和 95% CI 或 SE)以获得对显着性检验/95% 置信区间的误差项的准确估计?

感谢您提前提供任何帮助。