问题标签 [imputation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
8614 浏览

r - 如何用相邻值替换数据框中的 NA(缺失值)

我有一个像上面那样带有一些 NA 的数据框 x,我想使用相邻的非 NA 值来填充它,比如 2006-05-20 它将是 19&22 的平均值

问题是怎么回事?

0 投票
1 回答
3978 浏览

r - 绘制多重插补结果

我已经使用 R 中的 MICE 包成功完成了对问卷研究缺失数据的多重插补,并对汇总的插补变量进行了线性回归。我似乎无法弄清楚如何提取单个汇集变量并在图表中绘图。有任何想法吗?

例如

我想通过 TMAS 绘制汇集的 APE。

使用 nhanes 的可重现示例:

我想针对池化 bmi 绘制池化 chl(例如)。

我能做到的最好的是

我相信这给出了所有 5 个插补的组合图,并不是我想要的(我认为)。

0 投票
3 回答
14753 浏览

r - R:用向量中的项目替换NA

我正在尝试用类似组的平均值替换数据中的一些缺失值。

我的数据如下所示:

我希望它看起来像这样:

我写了这个,它奏效了

但是我的 data.frame 几乎有 50 万行长,而且 for/if 语句非常慢。我想要的是类似的东西

但这会出现大小不匹配的错误。似乎应该有一个命令可以执行此操作,但我在 SO 或 R 帮助列表中找不到它。有任何想法吗?

0 投票
2 回答
1342 浏览

r - R:通过一个通用 ID 合并列,而任何行上都没有任何 NA?

给定具有缺失值的数据,插补是用一些值替换缺失值的过程。目标是忽略具有缺失值的行,用 NA 表示。这样的行可以被视为数据的一个组成部分,因此该过程称为item imputation

输入

或者采用 CSV 格式,其中缺失值用 NA 标记

输出

预期结果是

我们只想要没有任何 NA 值的行。

如何将输入数据与列 V1、V2、V3 和行上没有 NA 的公共列 ID 合并?


使用 SQLDF 合并具有公共 ID 且无 NA 的列的示例解决方案

导致

0 投票
5 回答
44921 浏览

r - 将 R 中选定列中的所有 NA 替换为 FALSE

我有一个与此类似的问题,但我的数据集有点大:50 列,其中 1 列作为 UID,其他列带有TRUEor NA,我想将所有更改NAFALSE,但我不想使用显式循环。

plyr做到吗?谢谢。

更新#1

感谢您的快速回复,但如果我的数据集如下所示:

我只想X1X2被处理,这怎么办?

0 投票
26 回答
1752247 浏览

r - 如何在 R 数据框中用零替换 NA 值?

我有一个数据框,有些列有NA值。

如何NA用零替换这些值?

0 投票
3 回答
20537 浏览

r - R中的插补

我是 R 编程语言的新手。我只是想知道有没有办法在我们的数据集中只计算一列的空值。因为我见过的所有插补命令和库都插补了整个数据集的空值。

0 投票
4 回答
1265 浏览

r - R中的平均前后插补

我是 R 的新手。我的问题是如何使用缺失数据点之前和之后的平均值来估算缺失值?

例子;

使用每个 NA 的上下平均值作为估算值​​。

-第 3 行的平均值为 38.5

-第 7 行的平均值为 32.5

谢谢你。

0 投票
2 回答
3461 浏览

r - 大数据中的插补

我需要估算缺失值。我的数据集有大约 800,000 行和 92 个变量。我在 r 的 imputation 包中尝试了 kNNImpute,但看起来数据集太大了。R中的任何其他包/方法?我宁愿不使用均值来替换缺失值。谢谢你

0 投票
2 回答
463 浏览

r - 缺失值的插补

我想根据变量其他值的分布来估算数据集中的缺失值。

想象一下,30% 的值 = 1、20% = 2 和 50% = 3,实际上我想做以下事情:

有人可以帮忙吗?

约翰