我想以整洁的形式创建一个 data.table,其中包含 articleID、period 和 demand 列(以 articleID 和 period 作为键)。需求受随机函数的影响,输入数据来自另一个 data.frame (params)。它是在运行时为不同数量的周期创建的。
以“不整洁”的形式很容易做到这一点:
#example data
params <- data.frame(shape=runif(10), rate=runif(10)*2)
rownames(params) <- letters[1:10]
periods <- 10
# create non-tidy data with one column for each period
df <- replicate(nrow(params),
rgamma(periods,shape=params[,"shape"], rate=params[,"rate"]))
rownames(df) <- rownames(params)
有没有一种“整洁”的方式来进行这种创作?我需要复制 rgamma(),但我不确定如何让它使用相应文章的参数。我尝试从 data.table 的交叉连接开始:
dt <- CJ(articleID=rownames(params), per=1:periods, demand=0)
但我不知道如何在创建时直接正确地将 rgamma 传递给 dt[,demand] ,也不知道如何在不使用一些丑陋的 for 循环的情况下现在更改值。我还考虑使用 tidyr 包中的 gather(),但据我所知,我也需要使用 for 循环。
对于我当前的用例,我是否使用 data.frame 或 data.table 对我来说并不重要。任何(或两者!)的解决方案将不胜感激。