2

我有一个如下所示的 data.table:

tbl
          lon lat hour ens       date value
       1: 254  31   12   0 1994010100     0
       2: 254  31   12   0 1994010200     0
       3: 254  31   12   0 1994010300     0
       4: 254  31   12   0 1994010400     0
       5: 254  31   12   0 1994010500     0
      ---                                  
40494956: 269  39   24  10 2007122700   200
40494957: 269  39   24  10 2007122800   130
40494958: 269  39   24  10 2007122900   240
40494959: 269  39   24  10 2007123000   230
40494960: 269  39   24  10 2007123100   150

另一个看起来像:

locs
    lon lat
 1: 260  33
 2: 261  33
 3: 262  33
 4: 263  33
 5: 260  34
 6: 261  34

我目前正在使用 dcast 来实现我需要的形状:

temp <- dcast(tbl[locs], date ~ lon + lat + hour, fun.aggregate=mean, value.var="value")

这正是我想要的(甚至是列名!)但是非常慢。我想要一种 data.table 的方式,但是在这里阅读了几个线程之后,我仍然无法完全解决。我最近的尝试是这样的:

temp <- tbl[locs, list(mean = mean(value), sd = sd(value)), by = list(date, lon, lat, hour)]

折叠ens变量(效果很好,注意我也在计算 sd),但我无法重塑它。我的重塑尝试是:

temp[, as.list(setattr(list(mean,sd), 'names', list(lon, lat, hour))), by=list(date)]
Error in setattr(list(mean, sd), "names", list(lon, lat, hour)) : 
  'names' attribute [3] must be the same length as the vector [2]

任何帮助当然都非常感谢。谢谢你。

4

0 回答 0