3

我确实有一个看起来像这样的df:

time,v1,v1,v3,v4
1352639505, , ,94,101
1352639565, , ,94,101
1352639505,10,222, ,
1352639565,11,221, ,

第一个是 1970-01-01 的 UTC Timestamp - 所以我会使用 as.POSIXct(df$time,origin="1970-01-01",tz="UTC"). 但正如你所看到的,日期是双倍的。NA 和值被跳过。如何在数据框中合并相同的日期?首先设置为.POSIXct 还是合并?

结果应如下所示:

time,v1,v1,v3,v4
1352639505,10,222,94,101
1352639565,11,221,94,101

当然也可以是动物园之后的真实约会!谢谢!

4

1 回答 1

4

我会单独处理 data.frame 的每一列。对于每一列,从列和时间索引中删除缺失的观测值,然后构造您的zoo对象。然后您可以使用do.call来调用merge您的zoo对象列表。

# helper function to build zoo objects with no missing values
f <- function(v, i) {
  na <- is.na(v)
  iposix <- as.POSIXct(i, origin="1970-01-01", tz="UTC")
  zoo(v[!na], iposix[!na])
}
df <- structure(list(time = c(1352639505L, 1352639565L, 1352639505L, 
1352639565L), v1 = c(NA, NA, 10L, 11L), v1 = c(NA, NA, 222L, 
221L), v3 = c(94L, 94L, NA, NA), v4 = c(101L, 101L, NA, NA)), .Names = c("time", 
"v1", "v1", "v3", "v4"), class = "data.frame", row.names = c(NA, -4L))
library(zoo)
Data <- do.call(merge, lapply(df[-1], f, i=df$time))
Data
#                     v1 v1.1 v3  v4
# 2012-11-11 07:11:45 10  222 94 101
# 2012-11-11 07:12:45 11  221 94 101
于 2013-04-25T21:29:34.280 回答