这是我的第一篇文章,所以请多多包涵。下面是我的数据的一个小样本。我的实际数据集有超过 4,000 个单独的 ID,每个 ID 可以分配从一到两百美元不等的单独金额。
ID Dollars
001 17000
001 18000
001 23000
002 64000
002 31000
003 96000
003 164000
003 76000
使用示例可以最好地解释我本质上想要做的事情。我想为每个 ID 生成五个带有替换的随机样本。每个样本的大小为 5 或 5 个随机抽样的美元值。我的最终结果将有 20,000 个单独的样本(5 个样本,每 4000 个 ID,每个包含 5 个按 ID 随机选择的美元金额)。我这样做是为了将每个样本中的美元分布与具有相同 ID 的其他样本进行比较。
截至目前,我正在尝试使用下面引用的代码来获得这样的答案。我还应该指出,当我运行这个脚本时,我收到一个错误,我的“结果必须全部是原子的”。我不确定是否需要添加其他步骤或什么。
x <- function(func)
{
func<-(lapply(1:5, function(i)
sample(data$Dollars, size=5, replace=TRUE)))
}
grouped.samples<-ddply(data,.variables="ID",.fun=x)
如果我提出的问题不清楚,我很抱歉;我很难阐明我遇到的问题。
在此先感谢您的帮助