问题标签 [imputets]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何根据多个条件在 df 中创建新列?使用熊猫
在这里我需要创建基于其他列的新列
样本数据:
在这里我需要创建新列
column1 = 'M' & colum2 = '在线' --> 3 天
Column1 = 'M' & colum2 = 'offline' --> 5 天
像这样我需要创建新列
尝试了下面的代码,但我错过了逻辑
预期产出
time-series - 通过从 imputeTS 函数中提取数据来计算时间序列中的平均间隙大小
我需要计算单变量时间序列数据集的平均间隙大小。imputeTS包使用这些数据生成图。statsNA
是否可以从或中提取“间隙大小”和“出现次数” ggplot_na_gapsize
?或者有没有其他方法可以找到时间序列数据集中差距的平均大小?(您可以使用imputeTS包tsNH4
中的数据集)
(这是我第一次在这里提问,我对'r'还很陌生)
r - 我们如何检测和删除介于 NA 之间的变量并计算多个时间序列的 ACF?
这是我的玩具时间序列数据:
我想计算多个时间序列的自相关(acf)。忽略插补部分,我需要:
- 删除具有中间 NA 的变量(而不是时间序列开始和结束的变量),例如 2010 年 7 月 31 日的 A 的 NA。所以在这种情况下,删除变量 A。
- 可能使用 B 和 C 上 feasts 包中的 ACF 函数计算自相关性。
我从这里开始并陷入困境:
预期输出将具有每个可能的滞后序列的自相关。像 B 将有 10-11 个值 10 滞后和系列 B 相同
scikit-learn - 我尝试在 sklearn 中进行估算,但出现错误
我尝试下面的代码,但我有一些错误。
ValueError:输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值。
r - 为什么有些 R 包无法安装
我已经使用 R 一段时间了,安装软件包时一切正常。最近,我在Ubuntu 16.04
from 3.4.4
to上升级了 R 4.0.2
,然后我尝试将包安装imputeTS
为
然后
我尝试安装相同的软件包,install.packages("imputeTS", dependencies = TRUE)
但这给了我相同的结果 installation of package ‘imputeTS’ had non-zero exit status
接下来,我尝试安装软件包Hmisc
和mice
. 第一个mice
安装 as 的包也是同样的结果!
还有两个评论,第一个是(as ‘lib’ is unspecified)
升级 R 后才开始出现这个语句。第二个,我不确定是否相关,是我的 linux 上没有空间!
那么我怎样才能成功安装所需的软件包呢?
r - 根据 NA 值的百分比进行估算
我想估算来自 6 个不同气象站的温度值。每 30 分钟测量一次数据。我只想在一天和一个月的 NA 值超过 20% 时才估算这些值。所以我对每个日期/月的值进行分组,计算每个日期/月的 NA 平均值,然后我想过滤以保留小于 20% NA 的天/月,以便估算其余部分。最好的方法是什么?我对过滤器进行编码时遇到问题,因为我不确定它是否按照我想要的方式过滤。另外,以后估算缺失值的最佳方法是什么?我试图让自己熟悉imputeTS包,但我不确定我应该使用哪种方法。na_seadec
还是na_seasplit
别的什么?
我的数据(样本,使用 slice_sample 创建,n=20 来自 dplyr 包)
到目前为止我一直在使用的代码。我只是在第一步中按天分组。有几个月的数据缺少完整的几天,因此我需要过滤具有 > 20 % NA 的月份。
我不确定下一步该怎么做,我被卡住了。
r - 使用 ImputeTS 进行多变量时间序列预测?
有什么方法可以使用imputeTS进行具有多个回归变量的时间序列预测?我在 y 中有空白,带有 NA 的分钟级数据,而我所有的 X(x1,x2,.. xn) 都是没有 NA 的连续变量 ae
完整的数据集可以在这里找到
r - R按组插值
我有一个欧洲国家的数据框,每个国家出现 10 次(10 天)。我想插入多列的 NA 值,我可以使用
但我想按状态插入所有 NA 值。怎么可能呢?我已经尝试了很多不同的解决方案,但没有一个对我有用。
作为伪代码,我想要类似的东西
有什么可以起作用的吗?
不幸的是,这些代码示例对我不起作用
r - 错误:“imputeTS”的包或命名空间加载失败
我正在尝试在我的 R 版本 3.6.3 中加载在数据块上运行的 inputeTS 包。我写了以下命令
我收到消息
但是在尝试使用加载包时
我收到错误消息
你能建议我如何解决这个问题吗?
pandas - 通过计算上下栅栏内的平均值来估算缺失值
我想在我的数据框中估算“年龄”的缺失值。这是一个浮动对象。
通过这样做,
- 我想得到 IQR 并计算上下栅栏。
- 然后我想用数据集上下栅栏之间的平均值替换缺失值。
我正在尝试在我的代码中执行此操作,但无法使其正常工作。
我得到 TypeError 说:无法使用 dtyped [float64] 数组和 [bool] 类型的标量执行 'ror_'
先感谢您!