问题标签 [imputets]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
122 浏览

r - 天气数据中的多元插补缺失值

我需要准备好天气数据集作为 keras 的输入。我在 3 年的每日数据中有 1096 个条目,其中第一个月缺失。我从附近的气象站得到了其中一个填写温度的列。但是,为了检查哪种插补最合适,我删除了这 30 个值,并将所有列保留为第一个月的 NA。然后,我尝试了各种估算包,包括 1. 小鼠 - 给出连续值但平均值太高;2. KNN (VIM) 给出的常数值太高 3.MissForest - 给出的常数值太高;4. imputeTS_interpolation - 给出的连续值略低;5. imputeTS_seasonal - 给定值略低。因此,我选择了 imputeTS_interpolation。并在用实际值填充温度列后使用它来估算剩余的列。然而,我似乎无法让 imputeTS 工作的季节性。知道为什么吗?请在下面找到使用的数据文件和代码: 代码:

数据:

免责声明:我正在寻找一位合著者来帮助验证我在 keras / tensor flow 上的工作

0 投票
2 回答
93 浏览

python - 在python中处理具有季节性的缺失数据

如何使用 python 用季节性成分估算时间序列数据?

下面是我的数据看起来如何的示例,我长时间丢失包括许多周期的数据,并且不知道如何解决这个问题。

在此处输入图像描述

0 投票
5 回答
58 浏览

r - 将一个向量中的值替换为其他向量中的值

我有一个这样的数据框:

但是,我如何设法创建一个新向量,该向量从 var2 中获取值,并将其替换为 var1 中的 NA,否则只要从 var1 中获取值(1 或 2),只要它有一个值?

我在想类似的事情:

另一个数据帧也是如此,其中有更多向量:

在这种情况下,我想创建另一个向量“newvar”,它从 var2、var3 和 var4 中获取主导值,并将其替换为 var1 中的 NA。

因此,起点始终是 var1 中的内容。但是对于 id4 和 id5 fx,其他变量中没有显性值 - 然后我想用第一个变量中的值替换 NA,在这两种情况下,分别来自 var 2 和 var3 的值。

如何以简单的方式做到这一点?

谢谢!

0 投票
1 回答
24 浏览

imputets - “imputeTS”包中是否可以进行多重插补?

这是关于 R 中的“imputeTS”包。我想知道是否有办法使用这个包进行多重插补?任何有关这样做的可能性的指导/指示将不胜感激。

另外,我想知道有关检查缺失机制(MCAR、MAR、MNAR)的想法,特别是对于单变量时间序列。

0 投票
2 回答
43 浏览

r - 在 R 的数字数据框中使用函数 na_ma

我正在尝试使用na_ma来自的功能library(imputeTS);因为我通过用周围值的平均值替换它们来处理数据框中的缺失值。

数据示例:

我的代码

预期结果:

问题,我不知道如何应用na_ma(as.numeric(x), k = 1, weighting = "simple")到这个数据框的每一行。

谢谢!

0 投票
1 回答
47 浏览

r - 尝试在数据帧列表上使用“na_ma”时出现问题?

我是一个相当新手的 R 用户,但一直在尝试做一些简单的缺失值替换。(将 an 替换为NA之前和之后的值的平均值NA

我一直在使用库中的na_ma()函数imputeTS,它正在做我需要做的事情。

我已将其应用于列,然后是数据框,一切正常。我现在希望将其应用于数据框列表,但它似乎不起作用。

如果有人能指出我在这个问题上的最佳选择是什么,我将不胜感激。

0 投票
1 回答
37 浏览

r - 时间序列缺失值插补:如何在 na_kalman 中使用 maxgap?

因为我只是在寻找一种方法来避免时间序列插补中前导零的缺失值插补。由于前导零通常是时间序列中最长的缺失值序列,因此如果您使用全局模型预测面板数据,我想通过使用 maxgap 参数来控制这些影响。

maxgap 参数设置在插补过程中仍要替换的连续 NA 的最大值。

但是,如果我想避免替换任何长于 1 的 NA 系列并将 maxgap 设置为 1,则替换发生在更高的值上,而不是像我预期的那样相反。我如何在这里实现我所需要的?

这里有一些例子来说明:

0 投票
2 回答
55 浏览

r - R - 按组估算缺失值(线性/移动平均)

我有一个包含很多缺失值的大型数据集,我想通过组“名称”线性或移动平均来估算它。

希望结果可以像下面这样关闭:

我找到了这个这个。在没有 groupby 的情况下尝试了以下操作,但没有成功:

第一个报错如下:

所以我尝试了第二个,它一直加载很长时间,但什么也没发生。根据第一个链接的回复,

该包需要时间序列/向量输入(这就是为什么必须单独调用每一列的原因)。

任何帮助是极大的赞赏!