问题标签 [imputets]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
469 浏览

python - 如何根据多个条件在 df 中创建新列?使用熊猫

在这里我需要创建基于其他列的新列

样本数据:

在这里我需要创建新列

column1 = 'M' & colum2 = '在线' --> 3 天

Column1 = 'M' & colum2 = 'offline' --> 5 天

像这样我需要创建新列

尝试了下面的代码,但我错过了逻辑

预期产出

0 投票
1 回答
93 浏览

time-series - 通过从 imputeTS 函数中提取数据来计算时间序列中的平均间隙大小

我需要计算单变量时间序列数据集的平均间隙大小。imputeTS包使用这些数据生成图。statsNA是否可以从或中提取“间隙大小”和“出现次数” ggplot_na_gapsize?或者有没有其他方法可以找到时间序列数据集中差距的平均大小?(您可以使用imputeTStsNH4中的数据集)

(这是我第一次在这里提问,我对'r'还很陌生)

0 投票
1 回答
101 浏览

r - 我们如何检测和删除介于 NA 之间的变量并计算多个时间序列的 ACF?

这是我的玩具时间序列数据:

我想计算多个时间序列的自相关(acf)。忽略插补部分,我需要:

  1. 删除具有中间 NA 的变量(而不是时间序列开始和结束的变量),例如 2010 年 7 月 31 日的 A 的 NA。所以在这种情况下,删除变量 A。
  2. 可能使用 B 和 C 上 feasts 包中的 ACF 函数计算自相关性。

我从这里开始并陷入困境:

预期输出将具有每个可能的滞后序列的自相关。像 B 将有 10-11 个值 10 滞后和系列 B 相同

0 投票
1 回答
131 浏览

scikit-learn - 我尝试在 sklearn 中进行估算,但出现错误

我尝试下面的代码,但我有一些错误。

ValueError:输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值。

0 投票
1 回答
1012 浏览

r - 为什么有些 R 包无法安装

我已经使用 R 一段时间了,安装软件包时一切正常。最近,我在Ubuntu 16.04from 3.4.4to上升级了 R 4.0.2,然后我尝试将包安装imputeTS

然后

我尝试安装相同的软件包,install.packages("imputeTS", dependencies = TRUE)但这给了我相同的结果 installation of package ‘imputeTS’ had non-zero exit status

接下来,我尝试安装软件包Hmiscmice. 第一个mice安装 as 的包也是同样的结果!

还有两个评论,第一个是(as ‘lib’ is unspecified)升级 R 后才开始出现这个语句。第二个,我不确定是否相关,是我的 linux 上没有空间!

那么我怎样才能成功安装所需的软件包呢?

0 投票
0 回答
66 浏览

r - 根据 NA 值的百分比进行估算

我想估算来自 6 个不同气象站的温度值。每 30 分钟测量一次数据。我只想在一天和一个月的 NA 值超过 20% 时才估算这些值。所以我对每个日期/月的值进行分组,计算每个日期/月的 NA 平均值,然后我想过滤以保留小于 20% NA 的天/月,以便估算其余部分。最好的方法是什么?我对过滤器进行编码时遇到问题,因为我不确定它是否按照我想要的方式过滤。另外,以后估算缺失值的最佳方法是什么?我试图让自己熟悉imputeTS包,但我不确定我应该使用哪种方法。na_seadec还是na_seasplit别的什么?

我的数据(样本,使用 slice_sample 创建,n=20 来自 dplyr 包)

到目前为止我一直在使用的代码。我只是在第一步中按天分组。有几个月的数据缺少完整的几天,因此我需要过滤具有 > 20 % NA 的月份。

我不确定下一步该怎么做,我被卡住了。

0 投票
1 回答
50 浏览

r - 使用 ImputeTS 进行多变量时间序列预测?

有什么方法可以使用imputeTS进行具有多个回归变量的时间序列预测?我在 y 中有空白,带有 NA 的分钟级数据,而我所有的 X(x1,x2,.. xn) 都是没有 NA 的连续变量 ae

完整的数据集可以在这里找到

0 投票
3 回答
113 浏览

r - R按组插值

我有一个欧洲国家的数据框,每个国家出现 10 次(10 天)。我想插入多列的 NA 值,我可以使用

但我想按状态插入所有 NA 值。怎么可能呢?我已经尝试了很多不同的解决方案,但没有一个对我有用。

作为伪代码,我想要类似的东西

有什么可以起作用的吗?

不幸的是,这些代码示例对我不起作用

0 投票
1 回答
206 浏览

r - 错误:“imputeTS”的包或命名空间加载失败

我正在尝试在我的 R 版本 3.6.3 中加载在数据块上运行的 inputeTS 包。我写了以下命令

我收到消息

但是在尝试使用加载包时

我收到错误消息

你能建议我如何解决这个问题吗?

0 投票
0 回答
26 浏览

pandas - 通过计算上下栅栏内的平均值来估算缺失值

我想在我的数据框中估算“年龄”的缺失值。这是一个浮动对象。

通过这样做,

  1. 我想得到 IQR 并计算上下栅栏。
  2. 然后我想用数据集上下栅栏之间的平均值替换缺失值。

我正在尝试在我的代码中执行此操作,但无法使其正常工作。

我得到 TypeError 说:无法使用 dtyped [float64] 数组和 [bool] 类型的标量执行 'ror_'

先感谢您!