7

我正在尝试使用最新包(1.2.1)中的 dcast 对 value.var 为 POSIXct 类型的数据框(或 data.table)进行非规范化,但在生成的数据框中,日期值已丢失他们的 POSIXct 类并变成数字。

如果我希望将值恢复为 POSIXct 的值,我真的必须 as.POSIXct() 每个生成的列,还是我遗漏了什么?

x <- c("a","b");
y <- c("c","d");
z <- as.POSIXct(c("2012-01-01 01:01:01","2012-02-02 02:02:02"));
d <- data.frame(x, y, z, stringsAsFactors=FALSE);
str(d);
library(reshape2);
e <- dcast(d, formula = x ~ y, value.var = "z");
str(e);

运行上述语句的结果(注意新列 c 和 d 是数字纪元秒而不是 POSIXct):

> x <- c("a","b");
> y <- c("c","d");
> z <- as.POSIXct(c("2012-01-01 01:01:01","2012-02-02 02:02:02"));
> d <- data.frame(x, y, z, stringsAsFactors=FALSE);
> str(d);
'data.frame':   2 obs. of  3 variables:
 $ x: chr  "a" "b"
 $ y: chr  "c" "d"
 $ z: POSIXct, format: "2012-01-01 01:01:01" "2012-02-02 02:02:02"
> library(reshape2);
> e <- dcast(d, formula = x ~ y, value.var = "z");
> str(e);
'data.frame':   2 obs. of  3 variables:
 $ x: chr  "a" "b"
 $ c: num  1.33e+09 NA
 $ d: num  NA 1.33e+09
4

3 回答 3

10

执行debug(dcast)and debug(as.data.frame.matrix),然后逐步执行您的dcast()调用启动的计算将显示这些行as.data.frame.matrix()有问题:

if (mode(x) == "character" && stringsAsFactors) {
    for (i in ic) value[[i]] <- as.factor(x[, i])
}
else {
    for (i in ic) value[[i]] <- as.vector(x[, i])
}

最新的 POSIXct 对象具有 mode "numeric",因此评估遵循第二个分支,它将结果转换为数字。

如果你使用dcast(),看起来你需要对结果进行后处理,如果你有正确的origin. 像这样的东西(不太origin正确)应该可以解决问题:

e[-1] <- lapply(e[-1], as.POSIXct, origin="1960-01-01")

FWIW,基本 Rreshape()保留 POSIXct 值,但需要您编辑结果列的名称......

reshape(d, idvar="x", timevar="y",  direction="wide")
#   x                 z.c                 z.d
# 1 a 2012-01-01 01:01:01                <NA>
# 2 b                <NA> 2012-02-02 02:02:02
于 2012-09-06T00:40:43.630 回答
1

在投射/扩大数据集时,对日期完整性进行预处理和/或后处理可能非常麻烦。

在这方面,除非您需要的重塑很复杂,否则 tidyr包中的pivot_wider ()尊重日期对象——在此过程中没有转换。此外,它对铸造/加宽过程提供了更多控制,从而避免了后处理步骤 ( https://tidyr.tidyverse.org/reference/pivot_wider.html )。

于 2020-05-09T20:18:08.473 回答
0

我也刚遇到这个问题。我首先将日期字段强制转换为字符,然后进行 dcast,然后再转换回日期来解决它。

于 2015-08-06T22:38:23.223 回答