如果我有可能的小时数和可能的项目的向量:
possible.items = c(12,13,14,15,16)
possible.hours = 0:23
还有一些关于在购买这些商品的时间购买这些商品的客户的数据:
frame = data.frame(id=101:105, hour=c(0,0,0,1,1), item=c(12,14,12,12,15))
我将如何创建一个汇总数据框,其中每个可能的小时都有一行,项目组合中填充了我数据集中的相关行数?
我知道如何创建一个汇总数据框,但不知道如何创建一个包含不在我的原始数据集“框架”中的行:
summary = aggregate(id~hour+item, data=frame, FUN=length)
我还看到了一种获得所有可能组合的方法:
poss = merge(data.frame(hour=possible.hours), data.frame(item=possible.items), all=TRUE)
我不确定如何将两者结合起来。我也不知道我走的路是否正确。
我想得到一个看起来像这样的数据框:
hour item count
0 12 2
0 13 0
0 14 1
0 15 0
0 16 0
1 12 1
...
23 16 0