我有一个数据框,在 29 个变量(列)中有大约 1700 个观察值(行),我必须选择其中 7 个观察值的混合,其中(每个变量的)加权平均值与加权平均值(的1700 个观测值中的每个变量)。我尝试使用 boot() 引导 R 中的数据,目的是获得几种可能的混合物(计算所有可能的混合物需要很长时间),但我未能从整个数据集中仅选择 7 个观察值的样本。我知道自举通常会生成与原始数据集大小相同的样本。这是我尝试过的代码:
functionWAM<-function(data, i, p){
data<-data[sample(nrow(data), p),];
SAM<-weighted.mean(data[i,3], data[i,1]);
CAM<-weighted.mean(data[i,4], data[i,1]);
return(cbind(SAM,CAM))
}
WAMresults<-boot(datamatrix, statistic=functionWAM, R=1000, p=7)