我有一个包含不同长度的不同时间序列的数据帧列表。我想总结一个变量的计数,然后通过该特定数据集中包含的数据年数对其进行标准化。
所以使用示例数据框:
data_list <- list(data.frame(temp_bin = rep(1:4, 2:5), value = runif(14)),
data.frame(temp_bin = rep(1:4, 3:6), value = runif(18)),
data.frame(temp_bin = rep(1:4, 4:7), value = runif(22)))
# this might be ~10 different data sets with ~ 100k observations each
count <- lapply(data_list, function(x) {nrow(x)/5} )
# for real data this would be divided by 8760 for the # of hours in a year.
这大约是我想要做的,但是 n()/count 不起作用,因为 count 是一个列表。
data_bin <- data_list %>%
lapply(., group_by, temp_bin) %>%
lapply(., summarise, n = n()/count)
我尝试在 n 的定义内进行 lapply 或 mapply,但这似乎不起作用。还尝试分两步进行 - 创建获取原始 n 值,然后在下一步中使用 mapply 进行划分,但这也不起作用。