r - 创建引导样本并以不同的名称存储样本数据

Question

datta当我使用以下代码从数据框创建引导样本时

boot1a <- replicate(3, do.call("rbind", lapply(sample(unique(datta$pid),2000,replace=TRUE), function(x) datta[datta$pid==x,])), simplify=FALSE)
boot1b <- data.frame(boot1a) # data frame from the list
sample1 <- boot1b[order(boot1b$pid),] # sorting based on pid and storing

引导示例中的变量sample1名称以.1, .2, .3, .... （pid是个人 ID，对于同一个人的不同观察，它采用相似的值）。例如，在上面的代码中，变量xyindatta将具有名称xy, xy.1, 并xy.2与第一个、第二个和第三个引导样本相关联。我宁愿让不同的引导样本以不同的方式命名，每个样本中的变量名称与原始数据框中的变量名称相同。在上述情况下，我想要的是存储在三个不同数据帧中的引导样本，例如，boot1, boot2, boot3，其中每个数据框中的变量名称与原始数据框中的变量名称相同。我开始手动进行一次复制，但创建许多引导样本需要大量时间。有人对如何以更好的方式做到这一点有任何建议吗？

编辑数据框中许多变量中的四个变量的前几个观察结果datt如下。

    pid xy  zy  wy
     1  10  2   -5
     1  12  3   -4.5
     1  14  4   -4
     1  16  5   -3.5
     1  18  6   -3
     1  20  7   -2.5
     2  22  8   -2
     2  24  9   -1.5
     2  26  10  -1
     2  28  11  -0.5
     2  30  12  0
     2  32  13  0.5

score 2 · Accepted Answer

这是示例示例：

数据

set.seed(123)
data<-rnorm(100, 160, 20)
data1<-as.data.frame(matrix(data, nrow = 20, ncol = 5, byrow = FALSE))
n<-5
data2<-do.call("rbind", replicate(n, data1, simplify=FALSE))
data2$fac<-as.factor(rep(1:n,each=20))

采样

library(plyr)
sample1<-ddply(data2,.(fac),summarize, mysample=sample((1:length(fac)),size=1,replace=TRUE))
  fac mysample
1   1       18
2   2       14
3   3       13
4   4       20
5   5       14

r - 创建引导样本并以不同的名称存储样本数据

1 回答 1

Related

Reference