8

我确实有丢失数据的问题,但我没有 NA - 否则会更容易处理......

我的数据如下所示:

time, value
2012-11-30 10:28:00, 12.9
2012-11-30 10:29:00, 5.5
2012-11-30 10:30:00, 5.5
2012-11-30 10:31:00, 5.5
2012-11-30 10:32:00, 9
2012-11-30 10:35:00, 9
2012-11-30 10:36:00, 14.4
2012-11-30 10:38:00, 12.6

如您所见 - 缺少一些分钟值 - 它是 xts/zoo 所以我使用 as.POSIXct... 将日期设置为索引。如何添加缺少的时间步来获得完整的 ts?我想用线性插值填充缺失值。

感谢您的帮助!

4

2 回答 2

11

您可以merge使用包含所有日期的向量来处理您的数据。之后,您可以使用na.approx来填写空白(在这种情况下为 NA)。

data1 <-read.table(text="time, value
2012-11-30-10:28:00, 12.9
2012-11-30-10:29:00, 5.5
2012-11-30-10:30:00, 5.5
2012-11-30-10:31:00, 5.5
2012-11-30-10:32:00, 9
2012-11-30-10:35:00, 9
2012-11-30-10:36:00, 14.4
2012-11-30-10:38:00, 12.6", header = TRUE, sep=",", as.is=TRUE)
times.init <-as.POSIXct(strptime(data1[,1], '%Y-%m-%d-%H:%M:%S'))
data2 <-zoo(data1[,2],times.init)
data3 <-merge(data2, zoo(, seq(min(times.init), max(times.init), "min")))
data4 <-na.approx(data3)
于 2013-04-15T12:45:20.433 回答
6

感谢P Lapointe提供了一个很酷的答案。此外,如果您还利用 na.approx 中的 'xout' 参数,则不再需要进行合并:

data1 <-read.table(text="time, value
2012-11-30-10:28:00, 12.9
2012-11-30-10:29:00, 5.5
                   2012-11-30-10:30:00, 5.5
                   2012-11-30-10:31:00, 5.5
                   2012-11-30-10:32:00, 9
                   2012-11-30-10:35:00, 9
                   2012-11-30-10:36:00, 14.4
                   2012-11-30-10:38:00, 12.6", header = TRUE, sep=",", as.is=TRUE)
times.init <-as.POSIXct(strptime(data1[,1], '%Y-%m-%d-%H:%M:%S'))
data2 <-zoo(data1[,2],times.init)
data2
data4 <- na.approx(object=data2, 
          xout=seq(min(times.init), max(times.init), "min"))
于 2013-07-18T04:10:03.637 回答