3

我在做 Bagging,我想出了选择学习集(训练)的代码。

该数据集有 683 个观测值。

# data set named cancer
learningset <- cancer[sample(683,replace=TRUE),]

我需要得到测试集,在我的学习集中从未从原始数据集“癌症”中选择过哪些观察结果。

我一直在尝试许多功能,但似乎它们不起作用,因为我仍然可以看到学习集中存在一些观察结果。

4

2 回答 2

4

您可以尝试setdiff功能:

training.indices <- sample(683, replace=TRUE)
test.indices <- setdiff(1:683, training.indices)

接着:

learningset <- cancer[training.indices,]
testset <- cancer[test.indices,]
于 2013-04-14T04:34:12.667 回答
2

或者您可以-像这样使用运算符:

ind <- sample( 683 , replace = TRUE )
learningset <- cancer[ ind , ]
testset <- cancer[ - ind , ]
于 2013-04-14T06:44:44.480 回答