问题标签 [imputets]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R: 带有 NA 数据的 ts()
我有以下功能:
ts。数据返回
然而,
返回
我试过na.action=na.pass
了,但没有用。知道如何处理 NA,如果这是原因?
另外:有没有机会从第一次约会dat
开始?
r - 在 R 中使用 ROLLING 平均值估算缺失值
我是 R 新手,正在努力解决一个问题。
我需要一个函数来根据给定大小的窗口内元素的平均值来估算向量中的缺失值。
但是,这个窗口会移动,因为假设我NA
的位置是 30,我的窗口大小是 10,应该计算 的平均值x[20:40]
。因此,对于每个 found NA
,窗口均值会有所不同。
我一直在尝试这个:
但这是不正确的,我不知道如何继续。
r - 测试 R 中的缺失值
我有一个时间序列数据集,其中有一些缺失值。我希望估算缺失值,但我不确定哪种方法最合适,例如imputeTS
包中的线性、样条或斜线。
为了完整起见,我希望测试我的数据是否是 MCAR、MAR、NMAR。我很清楚它是 MCAR,但我有兴趣进行测试。
如您所见,我的 DF 中的某些列没有 NA 值。我希望只将具有 NATestMCARNormality
的列传递给 MissMech 包中的函数。
我尝试了以下方法,但我不断收到相同的错误:
使用 colnames 我得到列的索引,我引用 md.pattern 的上述输出来确定我正在使用具有 NA 值的列。
测试缺失值并仅将具有 NA 的列传递给TestMCARNormality
函数的聪明方法是什么?
r - R imputeTS 包中 na.kalman 函数的奇怪行为
我正在尝试imputeTS
包中的功能。这个包提供了几个函数来估算单变量时间序列数据中的缺失值。我对它们进行了测试,它们都很棒,除了na_kalman
功能。此函数更改原始数值向量。下面是一个例子。
如您所见,我创建了一个包含 10 个数字的向量,而前 5 个是NA
.
似乎dat2
显示该na_kalman
函数已成功估算NA
. 但是,原始向量 ,dat
也发生了变化。这是我想避免的行为。我想知道是否有办法要求na_kalman
不要更改原始向量。
笔记
当我将向量长度更改为较大的数字时,例如
rnorm(1000)
,我注意到其中的所有缺失值都dat
将更改为原始数据中的第一个非缺失值。看起来不像是简单的函数后的dat
副本。dat2
na_kalman
我还测试了
imputeTS
包中的其他功能,例如na_interpolation
,na_locf
,na_mean
. 他们没有这种行为。dat
运行这些函数后仍然是相同的向量。
r - 在 R 中使用复制约束估算缺失值
我正在分析一个长期的动物标记重新捕获数据集,其中捕获的个体在每次捕获时被分配到 5 个大小类别中的 1 个。我需要创建一个矩阵,该矩阵在已知值之间和之外进行插值(即观察动物的年数),并包括对个体可以在每个大小类别中停留多长时间的限制。
以下是跨越 20 年(列)的五个样本捕获历史记录(CH;个人=行)。有五种数字编码的可能尺寸等级(1=最小)。NA 是动物未被捕获的年份(此处视为缺失值)。
可以在任何尺寸等级中首次观察到个体(例如第 1 行与第 3 行),我们可能会重新捕获跳过某个尺寸等级的个体(例如,第 2 行)。
我已经想出了如何使用 imputeTS 包中的 na.interpolation() 函数插入没有约束的值,如下所示:
但是,我想限制一个人可以在每个大小级别中保留多少年。我正在努力寻找一个可以让我实现自定义约束的包。
我的“理想”输出如下所示。请注意,对于每一行的大多数(全部?)都有一个以上的解决方案,这很好,只要每个大小类别中的观察数不超过最大值(如下指定)。
任何建议或帮助将不胜感激。提前致谢。
r - 使用 R 中的 ImputeTS 在时间序列中进行缺失值插补
我有一个数据集,其中包含多个产品的每月时间序列。
每行都有相同的终点,但起点不同(因为该产品的时间戳可能开始较晚) 我需要估算中间缺失值,即实际起点和终点之间的值。
插补需要分 3 个步骤完成,即
- 将 na_seadec 用于序列长度超过 24 的时间序列
- 将 na_kalman 用于长度在 12 到 24 之间的时间序列
- 将 na_ma 用于长度小于 12 的时间序列
注意:时间序列的起点是该行的第一个非零值。
从第一列到第一个非零值的所有值都需要保持为零。
以下是使用 apply 函数和 if/else 条件的代码片段。
问题是当我执行上面的代码片段时,我收到以下警告:
结果,插补过程失败,没有插补缺失值。
您认为错误消息的原因是什么以及我该如何解决?
r - 无法将 kmeans 中的集群成员身份附加到 Shiny 中的原始数据
我正在尝试做一个小的闪亮的 Kmeans 练习,我下载一个 csv 文件并在其上运行 kmeans(忽略任何必需的预处理步骤)---获得集群后,我想将这些集群编号附加到原始数据并输出在交互式数据表中(来自 DT 包)......但我遇到了一个错误......下面的代码......
我收到以下错误:
不知道我做错了什么??
r - 在 R 中使用标题作为日期(时钟)格式
我有一个月的数据框(4 月 1 日 - 4 月 30 日)。按小时收集的数据。我想使用ggplot_na_distribution
(来自imputeTS包)创建时间序列图。问题是,如何将我的列名(标题)设置为时钟(00.00 - 23.00)?
2017 年 1 月 4 日 24,4 26,4 28,1 29,6 30,5 31 不适用 30,7
2017 年 2 月 4 日 25,8 27,3 29,2 30,1 31 32,2 32 31,4
2017 年 3 月 4 日 26,2 27,5 29 30,2 31,1 31,7 31,6 30,2
2017 年 4 月 4 日 24,8 25,8 27,8 29,3 30,8 31,6 不适用 29,4
2017 年 5 月 4 日 25,6 27,2 29,3 30,3 30,2 31,5 31,7 31,7
2017 年 6 月 4 日 25,7 25,9 26,6 28 28,4 27 28,7 30
对不起,如果我的问题没有说清楚。是的,名称(df)有效。但我的 df 不能由ggplot_na_distribution
. 它说,我的数据应该是单变量数据。我只想要我的数据,比如 tsAirgap 数据。在 tsAirgap 数据中,rowname 是 year,colname 是 month。在这种情况下,我希望我的 rowname 为 4 月 1 日 - 4 月 30 日,然后我的 colname df 是小时 00.00-23.00。
我感谢在我的帖子中写下的任何答案。非常感谢。对不起我的英语不好
r - 在 Azure ML 中安装额外的 R 包(ImputeTS R 包)
我参考了以下有关在 Azure ML 中安装附加 R 包的堆栈溢出查询。但是我收到了错误
Trail 1:为 Windows 安装 miniCRAN 包(https://cran.r-project.org/web/packages/imputeTS/index.html)
Trail 2: 为 windows 安装 ImputeTS 包 ( https://cran.r-project.org/web/packages/miniCRAN/index.html )
我按照下面的堆栈溢出查询问题进行了双重压缩并尝试了。但是,仍然面临同样的问题
我正在使用的 R 版本:CRAN 3.1.0
我需要使用package ImputeTS.
堆栈溢出查询链接: 在 Azure ML 上安装附加 R 包
错误一:
错误2:
R脚本:
注意: 代码中的所有其余包,即 dplyr、tidyr、lubridate 已经是 azure ml R 包的一部分。除了我正在尝试安装的 ImputeTS。