0

我想以整洁的形式创建一个 data.table,其中包含 articleID、period 和 demand 列(以 articleID 和 period 作为键)。需求受随机函数的影响,输入数据来自另一个 data.frame (params)。它是在运行时为不同数量的周期创建的。

以“不整洁”的形式很容易做到这一点:

#example data
params <- data.frame(shape=runif(10),   rate=runif(10)*2)
rownames(params) <- letters[1:10]
periods <- 10

# create non-tidy data with one column for each period
df <- replicate(nrow(params), 
                   rgamma(periods,shape=params[,"shape"], rate=params[,"rate"]))
rownames(df) <- rownames(params)

有没有一种“整洁”的方式来进行这种创作?我需要复制 rgamma(),但我不确定如何让它使用相应文章的参数。我尝试从 data.table 的交叉连接开始:

dt <- CJ(articleID=rownames(params), per=1:periods, demand=0)

但我不知道如何在创建时直接正确地将 rgamma 传递给 dt[,demand] ,也不知道如何在不使用一些丑陋的 for 循环的情况下现在更改值。我还考虑使用 tidyr 包中的 gather(),但据我所知,我也需要使用 for 循环。

对于我当前的用例,我是否使用 data.frame 或 data.table 对我来说并不重要。任何(或两者!)的解决方案将不胜感激。

4

1 回答 1

1

这会做(请注意,它假定params按行名排序,如果不是,您可以将其转换为 adata.table并合并两者):

CJ(articleID=rownames(params), per=1:periods)[,
  demand := rgamma(.N, shape=params[,"shape"], rate=params[,"rate"]), by = per]
于 2015-03-05T20:16:11.697 回答