问题标签 [r-mice]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 绘制多重插补结果
我已经使用 R 中的 MICE 包成功完成了对问卷研究缺失数据的多重插补,并对汇总的插补变量进行了线性回归。我似乎无法弄清楚如何提取单个汇集变量并在图表中绘图。有任何想法吗?
例如
我想通过 TMAS 绘制汇集的 APE。
使用 nhanes 的可重现示例:
我想针对池化 bmi 绘制池化 chl(例如)。
我能做到的最好的是
我相信这给出了所有 5 个插补的组合图,并不是我想要的(我认为)。
r - 来自`mids`对象的ggplot中的条形图
尽管已经使用了 ggplot 几次,但我真的很难在这个问题上取得任何进展。我想如果不尝试使用 ggplot 的可恶尝试,最容易解释我想要做什么,以下内容也很丑陋,但这是我目前能做到的最好的:(
我想创建一个漂亮的图表网格,在 ggplot 中显示这些条形图 - 例如,1 行 6,在 y 轴上都具有相同的比例,以便可以轻松比较它们。
我想我应该使用ldt <-complete(impute,"long", include=TRUE)
thenmelt(ldt, c(".imp",".id","hyp"))
但我就是不知道在那之后如何调用 ggplot :(
请注意,我的真实数据中有许多不同的变量,这仅适用于分类变量。我在想我可以制作一个函数,然后使用sapply
,但只能在分类列上运行?但我不知道该怎么做!
r - 没有刻面的ggplot
以下代码来自@ROLO 对我之前的问题的回答,生成了 3 个图:
我的问题是,如何修改它以单独绘制每个?
r - 使用 MICE 包进行多次插补后合并 Cox PH 结果
我有一个包含生存数据和一些缺失协变量的数据集。我已经成功地应用了mice-package来使用该mice()
函数来估算m个数据集,创建了一个imputationList
对象并在每个m数据集上应用了一个Cox PH模型。随后,我使用该函数汇总了结果MIcombine()
。这导致了我的问题:
如何获得每个协变量的汇总估计值的 p 值?它们是否隐藏在MIcombine
物体内的某个地方?
我知道 p 值并不是一切,但是在没有相应 p 值的情况下报告估计值和置信区间对我来说似乎很奇怪。我可以计算一个近似值。使用例如Altman 提供的公式从置信区间中获取 p 值,但这似乎过于复杂。我已经四处寻找答案,但我什至找不到任何人提到这个问题。我是否忽略了一些明显的东西?
例如:
我试图对 MIcombine 对象的结构进行排序,但到目前为止还没有找到 p 值。
r - 在 R 中使用 MICE 时内存不足
我正在尝试使用 MICE 包在 R 中创建多个插补,但 kepp 内存不足。这是我收到的错误消息:
我使用 64 位 R 和 windows 7 和 8 Gb 内存。我已经尝试增加实际内存,并且允许内存大小 R 分别使用 8 Gb 和 6.5 Gb,但它仍然不起作用。目前,我正在尝试对包含 27 000 行和 17 列的数据集进行插补,但我希望在具有 1 600 000 行和 17 列的更大数据上使用。
有人能帮我吗?将深深感激。
/杰斯珀
r - R中的鼠标问题:无法将“mids”类强制转换为data.frame
我有一个包含大约 11,500 行和 15 个因子的数据集。我只需要估算其中 3 个因子的值,其中只有 2 个因子具有大量缺失值。我一直在尝试使用鼠标来创建估算数据集,并且我正在使用以下代码:
在此代码之后,我收到错误消息:
as.data.frame.default(data) 中的错误:无法将“mids”类强制转换为 data.frame
我完全不知道这意味着什么。只需删除丢失的数据并使用常规 glm,我就可以轻松进行相同的分析。我还想使用 lmer 对估算数据集做一个多级逻辑模型(这是我使用 glm 后的下一步),所以如果我做错了什么也会影响下一步,那将也很高兴知道。我试图在互联网上搜索此错误,但我无处可去。我只是真的在学习 R,所以我对环境还不太熟悉。
谢谢你的时间!
r - R 的多个实例产生与 MICE 相同的插补 - 随机种子问题?
多重插补包mice
使用可以使用set.seed
参数设置的随机数生成器。我正在运行 R 的多个实例(即 3 个),其中相同的数据使用相同的mice
参数进行估算,set.seed=NA
其中没有指定任何种子值。
然而,R 的三个实例产生完全相同的插补。我对这个观察感到困惑,因为我认为 R 的不同实例在使用时应该使用不同的种子值set.seed=NA
,但看起来它们使用的是相同的。当我set.seed
手动设置时,会产生不同的插补。
我的问题是:这是否合理,或者是否存在导致种子相同的计算机(PC windows 7)问题,即使我设置了set.seed=NA
. 我欢迎任何关于这个问题的想法。
顺便说一句:我使用 R 的多个实例,因为 MICE 函数ibind()
可用于组合mids
(乘以估算数据集)对象。因此,它可以节省多核系统的计算时间。如果产生相同的插补,这当然是无稽之谈。
r - MICE 中的“前导次要 % 不是正确定的”错误
mice
在使用大量数据(30 个分类预测变量和预测变量,
n = 1000)在 R 中运行时,我收到以下错误:
错误
chol.default(fit.sum$cov.unscaled)
:17阶的前导小调不是正定的
我polyreg
对大多数变量使用(多项回归)作为插补方法。由于我不知道为什么会发生此错误,因此我无法发布更多可以重现它的代码。
在 MICE 中使用线性回归时,我在这里发现了一个类似问题的帖子。这篇文章在 Cross Validated 上没有收到任何答案。
如本文所述,这也可能与吉布斯抽样中必要的某些程序有关。OP 在自编程函数中使用 描述了此错误MCMC
,这与 MICE 使用的程序有关。
我不知道什么是领先的未成年人——如果有人能告诉我,也许那将是一个开始。
r - R 中的插补 MICE 仍留在数据集中
运行 MICE 包后,在 5 个完整的插补集中,缺失值的数量从 147428 减少到 46093。但是它不应该是0 NA吗???
谢谢!
这是我的 MICE 代码:
r - 结合来自多个插补数据的 ROC 估计
我使用了以下 R 包:mice
、mitools
和pROC
.
基本设计:在 n~1,000 上缺失数据率介于 5% 和 70% 之间的 3 个预测指标。1 个二元目标结果变量。
分析目标:确定 3 个预测变量中的每一个的 AUROC。
我用这个mice
包来估算数据,现在有m个估算数据的数据集。使用以下命令,我可以获得m个数据集的每一个的 AUROC 曲线:
我可以毫无问题地看到每个m个数据集的估计值。
为了组合参数,我尝试使用 mitools
我收到以下错误消息:
"Error in pool(fit): Object has no vcov() method"
。
当组合来自m个数据集的系数估计时,我的理解是这是系数的简单平均值。但是,误差项更复杂。
我的问题:如何合并“m”ROC 参数估计值(AUROC 和 95% CI 或 SE)以获得对显着性检验/95% 置信区间的误差项的准确估计?
感谢您提前提供任何帮助。