0

有什么方法可以使用imputeTS进行具有多个回归变量的时间序列预测?我在 y 中有空白,带有 NA 的分钟级数据,而我所有的 X(x1,x2,.. xn) 都是没有 NA 的连续变量 ae

DateTime        Processed   Avg     1_Q   Median    3_Q

04/01/20 3:22       3       1.8      1      2       2.5
04/01/20 3:23       3       1.6      1      1       2
04/01/20 3:24       1       1.5      1      1       2
04/01/20 3:25       1       1.2      1      1       1
04/01/20 3:28       1       1.1      1      1       1
04/01/20 3:29       1       1.7      1      1.5     2.8
04/01/20 3:32       1       1.6      1      1       2
04/01/20 3:33       2       1.4      1      1       2
04/01/20 3:35       1       1.4      1      1       1.8
04/01/20 3:38               1.4      1      1       2
04/01/20 3:39       2       1.4      1      1       2
04/01/20 3:41               1.2      1      1       2
04/01/20 3:42               1.2      1      1       1.8
04/01/20 3:44       1       1.3      1      1       2
04/01/20 3:45       1       1.2      1      1       1
04/01/20 3:46       1       1.6      1      2       2
04/01/20 3:47       1       1.8      1      2       2
04/01/20 3:48               1.2      -      1       2
04/01/20 3:52               1.3      1      1       1.3
04/01/20 3:53       2       1.9      1      2       2
04/01/20 3:54       1       0.9      1      1       1
04/01/20 3:56       1       1.3      1      1       1
04/01/20 3:57       2       1.1      1      1       1

完整的数据集可以在这里找到

4

1 回答 1

0

imputeTS非常适合时间序列插补(您可以及时使用一个变量的相关性)

在您的情况下,其他变量(变量间相关性)中有很多有用的信息。imputeTS执行单变量时间序列插补,因此它只查看每个变量及其在时间上的相关性。

由于您的变量Avg, 1_Q, Median,3_Q似乎与Processed(您的缺失数据所在的位置)高度相关,因此可能另一个包是更好的选择。missForestimputeR和其他采用变量间相关性(但不是时间间相关性)的软件包将是更好的选择。

如果您想出自己的缺失数据插补程序,您可能会得到更好的结果。丢失的数据似乎总是在Processed并且Avg,似乎是关于 的统计Median数据。也许例如总是使用四舍五入到最接近的数字作为替代已经相当不错了。3_QProcessedAvgProcessed

于 2020-12-06T16:18:16.947 回答