问题标签 [imputation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R:加权插补/插补偏好
假设我有一个包含多列的数据集,其中之一是gender
. 据我了解,knnImputation()
使用标准选项将计算所有变量都被平等对待的度量标准,而我希望创建一些规则,例如,gender
在搜索邻居时强烈首选相同的规则(例如,gender
对总权重或仅选择具有相同性别的行(这可以通过拆分然后重新组装训练和测试集来完成,但也许存在更简单的方法)。
我看到它kNNImpute()
具有impute.fn
用于插补函数的参数和knnImputation()
具有meth
用于方法的参数。我怎样才能创建这样一个灵活且易于编辑的规则(例如,编写为类似的函数)?
r - R:从 with.mids() 中的字符串构建公式
我希望能够基于从字符串构造的公式对mids
返回的对象运行回归。mice()
对于普通回归(没有插补),这很容易:
我认为在估算数据集上做同样的事情应该是这样的:
然而,R 告诉我,object 'bmi' was not found
.
工作得很好,但需要我硬编码列名而不是提供字符串变量。
有没有办法做到这一点?
r - 如何在 R 中使用循环找到 RMSE
如果我有一个数据框包含 3 个变量:
我创建了 MCAR(随机缺失完整)数据:
之后,我使用mice
包来估算缺失值,如下所示:
我的问题是:我想通过使用循环分别找到所有 10 个数据集的 RMSE。这是我的 RMSE 方程:
我的意思是做一个循环来分别找到每个估算数据集的 RMSE:
RMSE1(对于数据集 #1)
RMSE2(对于数据集 #2)
...
RMSE10(对于数据集 #10)
而且我还想知道哪个数据集最适合 impute NA
。
r - 如果列名相同,则替换列 R
我在 R 中使用了 mouse 包来估算我的数据中的一些缺失值,但不是针对所有变量。现在,如果它们的列名相同,我想用估算数据中的列替换原始数据中的列。这是我的功能:
但它似乎不起作用,有什么帮助吗?
bash - 未找到 shapeit 命令 - 用于 GWAS 定相的 shapeit 安装
我想为 GWAS 定相和估算安装 shapeit。我从 Shapeit 网站下载了适用于 macos 的 Shapeit 版本:
https://mathgen.stats.ox.ac.uk/genetics_software/shapeit/shapeit.html#download
我提取了该文件并获得了 shapeit 可执行文件、示例文件夹和许可文件。
接下来,我在 Mac 中打开终端,将目录 cd 到 shapeit 文件夹并按照网站的提示键入命令行:
我得到了回应:
我想这意味着我需要安装 shapeit 或为 shapeit 设置路径。但我不知道该怎么做。我对 Macos 很陌生。
有人可以帮助我吗?
r - 在偏最小二乘 (PLS) 中组合多重插补的结果(非正态分布)
我将 IPW 和 MI 与 PLS 结合使用,在每个 MI 模型中,我都计算了 95%CI。我的问题是如何将 95%CI 的结果结合到最终结果中。下面是我正在使用的示例脚本。假设感兴趣的参数不服从正态分布。
coeftable[[i]] 包含每个 MI 模型中的系数和 95%CI。
下面是一个 MI 模型的 coeftable,我的预期输出应该是这样的,但呈现了所有 MI 模型的总体估计。
r - 用该列的中位数替换矩阵每一列中的 NA
我正在尝试用该列的中位数替换矩阵每一列中的 NA,但是当我尝试使用lapply
或sapply
出现错误时;当我使用for循环并且一次更改一列时,代码有效,我做错了什么?
例子:
r - 如何从 Amelia 包中提取完整的数据集
在用于提取完整数据集的鼠标包中,您可以使用complete()
以下命令:
但是有人能告诉我如何在 Amelia 包中提取完整的数据集吗?
r - 从 mi 包返回完整的数据集,没有缺失指标
我使用mi
包估算了这个不完整的数据,如下所示:
complete()
命令返回了完整的数据集,但我想返回这个完整的数据集,但不包含(TRUE / FALSE 列)[missing_x,missing_y,missing_z]。