r - 带日期的外产品

Question

给定一个日期时间值向量，我需要在每个原始日期时间之后的几个小时内创建一个data.frame包含日期0:10时间 - 第一列过去 0 小时，第二列过去 1 小时，等等。

lubridate我很难找到一种使用东西轻松做到这一点的方法。我认为这应该工作：

rt <- ymd_hms(c("2011-11-03 19:24:12", "2011-10-28 20:48:21",
  "2011-11-04 10:06:14", "2011-10-31 17:10:05", "2011-10-28 06:35:59"))
result <- outer(rt, hours(0:10), "+")

但是该管道中的各个部分都发生了故障。最终我得到这个错误：

Error in FUN(X[[1L]], ...) : invalid 'times' argument

这似乎来自rep.POSIXct()' 或rep.period()' 无法处理非单位长度times参数。或者其他的东西。

而且它可能无论如何都不会起作用，因为outer()返回一个矩阵和日期对象，即使是 POSIXct 日期（内部只是整数），它似乎也不能是矩阵中的元素。

经过大约 10 次其他猜测后，我发现有效（只是为了获取时间，而不是将它们放入数据框中）是：

with_tz(do.call(c, lapply(rt, function(x) x+hours(0:3))), tz(rt[1]))

with_tz()添加是必要的，因为丢失c()了时区属性。我也必须这样做，do.call(c, lapply(...))而不仅仅是sapply(...)因为sapply()失去了约会的事实。

也许另一种选择是通过做某事来创建一个数据框do.call(cbind, ...)。

一般来说，如果我们发现 R 日期/时间任务在概念上看起来很简单，但在找到解决方案之前需要大量练习，我们可以通过更改lubridate或其他方式来消除障碍。我想这可能是其中之一。=)

score 4 · Accepted Answer

这不使用outer()，但我认为它可以让你到达你想要的地方。它确实使用plyr.

library("lubridate")
library("plyr")

rt <- ymd_hms(c("2011-11-03 19:24:12", "2011-10-28 20:48:21",
  "2011-11-04 10:06:14", "2011-10-31 17:10:05", "2011-10-28 06:35:59"))

offsets = 0:10
names(offsets) <- offsets

dat <- data.frame(llply(offsets, function(offset){rt+hours(offset)}))

为offsets变量命名只会使列名data.frame更好。

> str(dat)
'data.frame':   5 obs. of  11 variables:
 $ X0 : POSIXct, format: "2011-11-03 19:24:12" "2011-10-28 20:48:21" ...
 $ X1 : POSIXct, format: "2011-11-03 20:24:12" "2011-10-28 21:48:21" ...
 $ X2 : POSIXct, format: "2011-11-03 21:24:12" "2011-10-28 22:48:21" ...
 $ X3 : POSIXct, format: "2011-11-03 22:24:12" "2011-10-28 23:48:21" ...
 $ X4 : POSIXct, format: "2011-11-03 23:24:12" "2011-10-29 00:48:21" ...
 $ X5 : POSIXct, format: "2011-11-04 00:24:12" "2011-10-29 01:48:21" ...
 $ X6 : POSIXct, format: "2011-11-04 01:24:12" "2011-10-29 02:48:21" ...
 $ X7 : POSIXct, format: "2011-11-04 02:24:12" "2011-10-29 03:48:21" ...
 $ X8 : POSIXct, format: "2011-11-04 03:24:12" "2011-10-29 04:48:21" ...
 $ X9 : POSIXct, format: "2011-11-04 04:24:12" "2011-10-29 05:48:21" ...
 $ X10: POSIXct, format: "2011-11-04 05:24:12" "2011-10-29 06:48:21" ...

更新：

肯关于ldply()vs的评论data.frame(llply())让我意识到还有另一种方法可以解决这个问题。

dat <- ldply(rt, `+`, hours(0:10))

这使

> str(dat)
'data.frame':   5 obs. of  11 variables:
 $ V1 : POSIXct, format: "2011-11-03 12:24:12" "2011-10-28 13:48:21" ...
 $ V2 : POSIXct, format: "2011-11-03 13:24:12" "2011-10-28 14:48:21" ...
 $ V3 : POSIXct, format: "2011-11-03 14:24:12" "2011-10-28 15:48:21" ...
 $ V4 : POSIXct, format: "2011-11-03 15:24:12" "2011-10-28 16:48:21" ...
 $ V5 : POSIXct, format: "2011-11-03 16:24:12" "2011-10-28 17:48:21" ...
 $ V6 : POSIXct, format: "2011-11-03 17:24:12" "2011-10-28 18:48:21" ...
 $ V7 : POSIXct, format: "2011-11-03 18:24:12" "2011-10-28 19:48:21" ...
 $ V8 : POSIXct, format: "2011-11-03 19:24:12" "2011-10-28 20:48:21" ...
 $ V9 : POSIXct, format: "2011-11-03 20:24:12" "2011-10-28 21:48:21" ...
 $ V10: POSIXct, format: "2011-11-03 21:24:12" "2011-10-28 22:48:21" ...
 $ V11: POSIXct, format: "2011-11-03 22:24:12" "2011-10-28 23:48:21" ...

请注意，除了不同的列名（V1-V11 而不是 X0-X10）之外，这些日期已转换为本地时间（在我的情况下为 PDT）：

> dat$V1
[1] "2011-11-03 12:24:12 PDT" "2011-10-28 13:48:21 PDT"
[3] "2011-11-04 03:06:14 PDT" "2011-10-31 10:10:05 PDT"
[5] "2011-10-27 23:35:59 PDT"

r - 带日期的外产品

1 回答 1

Related

Reference