我在做 Bagging,我想出了选择学习集(训练)的代码。
该数据集有 683 个观测值。
# data set named cancer
learningset <- cancer[sample(683,replace=TRUE),]
我需要得到测试集,在我的学习集中从未从原始数据集“癌症”中选择过哪些观察结果。
我一直在尝试许多功能,但似乎它们不起作用,因为我仍然可以看到学习集中存在一些观察结果。
我在做 Bagging,我想出了选择学习集(训练)的代码。
该数据集有 683 个观测值。
# data set named cancer
learningset <- cancer[sample(683,replace=TRUE),]
我需要得到测试集,在我的学习集中从未从原始数据集“癌症”中选择过哪些观察结果。
我一直在尝试许多功能,但似乎它们不起作用,因为我仍然可以看到学习集中存在一些观察结果。
您可以尝试setdiff
功能:
training.indices <- sample(683, replace=TRUE)
test.indices <- setdiff(1:683, training.indices)
接着:
learningset <- cancer[training.indices,]
testset <- cancer[test.indices,]
或者您可以-
像这样使用运算符:
ind <- sample( 683 , replace = TRUE )
learningset <- cancer[ ind , ]
testset <- cancer[ - ind , ]