问题标签 [r-mice]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2573 浏览

r - 在 R 包中导入鼠标功能时出错

我想在我的包中包含mice::mice 函数来对我的数据执行插补。

我使用 Roxygen 列出进口

这个函数在我测试代码时工作正常,但是当我构建包并尝试使用它时,我收到以下错误

我试图将错误中提到的所有功能添加到导入中,但它对结果没有任何影响。

我错过了什么?我从来没有发现过这样的问题。

0 投票
0 回答
1405 浏览

r - 鼠标包中的R完整功能

我正在尝试使用 R 中的 MICE 包来估算数据。我可以包含我的数据,但我认为这不是这里的问题。

当我尝试运行“完成”功能时:

我得到:

有任何想法吗?它为什么要寻找路径?我的第一篇 StackFlow 帖子,如果我需要包含更多信息,请告诉我。


这里的一个例子

在这一点上,一切都符合教程。然后我运行:

我收到错误消息:

` list.files(目录)中的错误:无效的“路径”参数

0 投票
2 回答
2412 浏览

r - 使用具有聚类数据的小鼠进行插补

所以我使用mice包来估算丢失的数据。我是插补的新手,所以我已经到了一定程度,但遇到了陡峭的学习曲线。举个玩具例子:

如您所见,我主要使用默认设置对 df1 进行了 10 次估算——我很乐意在回归模型、汇总结果等中使用此结果。但是在我的现实生活数据中,我有来自不同国家的调查数据。因此,缺失的程度因国家而异,特定变量的值也不同——即年龄、教育水平等。因此,我想估算缺失,允许按国家/地区进行聚类。所以我将创建一个没有缺失的分组变量(当然在这个玩具示例中,与其他变量的相关性缺失,但在我的真实数据中它们存在)

那么我如何判断mice()这个变量与其他变量不同 - 即它是多级数据集中的一个级别?

0 投票
0 回答
1857 浏览

r - R MICE no 时调用mice() 后仍然存在缺失数据。变量很大

我不确定这背后的原因是什么。

我有一个包含 107 个变量的数据集(混合了数字和因子数据类型),其中一些包含缺失值。我用老鼠来估算数据。

MICE 估算了大多数变量的数据。然而,一些变量根本没有被估算。

很奇怪,虽然有些变量被成功地估算了,但有些却没有。我还尝试仅在未成功估算的变量上运行 MICE,这一次成功了。

这背后的原因是什么?它与我的数据集中的变量数量有什么关系吗?我该如何解决这个问题,或者我需要为每个变量单独运行鼠标?

非常感谢,

编辑我现在给出代码来复制我的意思。

0 投票
1 回答
736 浏览

r - 鼠标包错误不清楚

我正在使用mice 包来插入一些缺失值。我在很多情况下都成功地使用了鼠标,没有任何问题。但是我现在面临一个前所未有的问题,即在第一次迭代后出现以下错误:

我试图查看文档,但找不到任何有用的东西。我在互联网上查找了错误并找到了这个https://stat.ethz.ch/pipermail/r-help/2015-December/434914.html但我无法找到所描述问题的答案。

遗憾的是,我无法提供数据的工作示例,因为 my_data 包含我不拥有的私有数据,因此无法公开。my_data 是一个 dplyr 数据帧,但是看起来使用 dplyr 或“基础”数据帧没有区别。

谁能解释一下发生了什么以及(可能)如何解决它?谢谢你。

编辑:添加了更多关于回溯的信息:

0 投票
0 回答
82 浏览

r - 使用 as.mids2 时的错误消息

我正在尝试通过使用 R 中的 miceadds 包从 SPSS 创建的多重插补数据库中汇集结果(我对 R 很陌生,如果术语有点偏离,我很抱歉)。当我尝试使用 as.mids2 代码将数据库更改为 mids 对象时,我收到以下错误消息:

有人知道这意味着什么吗?数据库是 28 个变量,有 2378 个 obs,所以不大。

这是我正在使用的脚本:

任何帮助将不胜感激。

0 投票
0 回答
284 浏览

r - 如何在 glm.mids 中使用构造公式

处理大量变量并paste0()使用传递给函数的变量通过构造公式 (via) 处理它们。我偶然发现了一个我无法弄清楚的问题/错误。用一个玩具例子最容易解释:

我该如何解决这个问题?为什么找不到BMI?

0 投票
2 回答
1373 浏览

r - 使用 MICE 包进行缺失值插补的错误

我有大量(4M x 17)缺失值的数据。两列是分类的,其余的都是数字的。我想使用 MICE 包进行缺失值插补。这是我尝试过的:

在整个数据集上运行插补计算成本很高,所以我只在前 10 万个观测值上运行它。然后我尝试使用输出来估算整个数据。

我的方法有什么问题吗?如果是,我应该怎么做才能使它正确?如果不是,那么为什么我会收到此错误?

0 投票
1 回答
527 浏览

r - MICE - 如何为每个子集而不是整个 data.frame 生成缺失值

我正在尝试分析一些数据作为我论文的一部分,但开发代码被证明是不可能的(对我来说)

我正在使用更大数据的子集来开发我的代码。(不知道如何链接数据框)

本质上,X,Y值来自 24 孔板。记录周期结束后,该grp值将增加 N+1(只是巧合,grp/well以相同的值结束)。

在每个记录周期之后,记录会中断,一旦完成,记录将恢复。我目前正在尝试分析我设置为的数据中的缺失值NA。为了找到缺失的值,我使用了 MICE 包,使用了这段代码(如下)。我希望wellMICE 包单独分析每个组,而不是一次性分析所有X坐标Y

两件事 - 首先,for 循环非常慢,我不确定提高脚本速度的方法。我最初的想法是在我的 df 中创建一个新列,每次df$well值更改时都会填充 N+1 ,因为这将包含df$well& df$grp,但我一直无法想出一个函数来生成它。生成新列后,我可以使用一个 for 循环,而不是上面的两个 - 我认为这会提高速度吗?其次,上面的脚本不断地重写“temp_df”,而我要求它添加到它——我尝试使用搜索结果中建议的“rbind”和“apply”,但无济于事。

如果这看起来相对简单,或者已经在其他地方得到了回答,我们深表歉意。正如我所说,我对 R 和一般的计算语言相对较新。

0 投票
2 回答
860 浏览

r - R - 如何将公式传递给函数内部的 with(df, glm(y ~ x)) 构造

我正在使用miceR 中的包来对一些缺失的数据进行乘法估算。我需要能够指定传递给with(df, glm(y ~ x))函数内部构造的公式。这种with()结构是包用于在每个估算数据集中mice分别拟合回归模型的格式。

但是,我无法弄清楚阻止我成功将公式作为参数传递的范围问题。这是一个可重现的示例:

另请参阅此处以了解在 R 帮助上提出的相同问题,尽管它没有收到答案。