我有一个如下所示的 data.table:
tbl
lon lat hour ens date value
1: 254 31 12 0 1994010100 0
2: 254 31 12 0 1994010200 0
3: 254 31 12 0 1994010300 0
4: 254 31 12 0 1994010400 0
5: 254 31 12 0 1994010500 0
---
40494956: 269 39 24 10 2007122700 200
40494957: 269 39 24 10 2007122800 130
40494958: 269 39 24 10 2007122900 240
40494959: 269 39 24 10 2007123000 230
40494960: 269 39 24 10 2007123100 150
另一个看起来像:
locs
lon lat
1: 260 33
2: 261 33
3: 262 33
4: 263 33
5: 260 34
6: 261 34
我目前正在使用 dcast 来实现我需要的形状:
temp <- dcast(tbl[locs], date ~ lon + lat + hour, fun.aggregate=mean, value.var="value")
这正是我想要的(甚至是列名!)但是非常慢。我想要一种 data.table 的方式,但是在这里阅读了几个线程之后,我仍然无法完全解决。我最近的尝试是这样的:
temp <- tbl[locs, list(mean = mean(value), sd = sd(value)), by = list(date, lon, lat, hour)]
折叠ens
变量(效果很好,注意我也在计算 sd),但我无法重塑它。我的重塑尝试是:
temp[, as.list(setattr(list(mean,sd), 'names', list(lon, lat, hour))), by=list(date)]
Error in setattr(list(mean, sd), "names", list(lon, lat, hour)) :
'names' attribute [3] must be the same length as the vector [2]
任何帮助当然都非常感谢。谢谢你。