我正在尝试遍历数据框的每一行,随机选择一半变量,并将该特定行的变量设置为NA
.
例如,对于mydf
下面的数据集,我希望我的第一行随机选择 3 个变量(例如QB
、QE
、QF
)并将它们的分数设置为NA
,然后再次为第二行(例如QA
、QD
、QE
)等等:
library(tibble)
mydf <- tibble(QA = rnorm(100),
QB = rnorm(100),
QC = rnorm(100),
QD = rnorm(100),
QE = rnorm(100),
QF = rnorm(100))
我的尝试,但它似乎没有做任何事情:
vars <- names(mydf)
for (i in nrow(mydf)){
miss_vars <- sample(vars, 3)
for (j in miss_vars) {
mydf[i,j] <- NA
#mydf[i,][[j]] <- NA #Also tried this.
}
}