以下是我目前创建两个独立样本 DS 和 RS 的方式:
data$rnd<-runif(nrow(data),0,1)
fraction<-0.5
DS<-subset(data, rnd <= fraction)
RS<-subset(data, rnd > fraction)
显然,这只会给我两个大小大致相等的样本。我想如果我能得到完全相等的分割(但是我的样本有不相等的 n),我的交叉验证分析会更有效。我想到了一个自然数生成器,它只在 1 和 N 之间选择每个数字一次,但我什么也没找到。