我想从数据集中选择一个样本两次。实际上,我不想选择它,而是要创建一个新变量sampleNo
来指示一个案例属于哪个样本(一个或两个)。
假设我有一个包含 40 个案例的数据集:
data <- data.frame(var1=seq(1:40), var2=seq(40,1))
我画的第一个样本(n=10)是这样的:
data$sampleNo <- 0
idx <- sample(seq(1,nrow(data)), size=10, replace=F)
data[idx,]$sampleNo <- 1
现在,(我的问题从这里开始)我想绘制第二个样本(n=10)。但是这个样本应该只从不属于第一个样本的案例中抽取。此外,“var1”应该是偶数。
所以sampleNo
对于根本没有抽取的案例应该是 0,对于属于第一个样本的案例应该是 1,对于属于第二个样本的案例应该是 2(=sampleNo
等于 0 并且var1
是偶数)。
我试图这样解决它:
idx2<-data$var1%%2 & data$sampleNo==0
sample(data[idx2,], size=10, replace=F)
但是我怎样才能设置sampleNo
为 2?