我正在使用 R 中的 rpart 进行分类。树模型由以下人员训练:
> tree <- rpart(activity ~ . , data=trainData)
> pData1 <- predict(tree, testData, type="class")
此树模型的准确度为:
> sum(testData$activity==pData1)/length(pData1)
[1] 0.8094276
我阅读了一个通过交叉验证修剪树的教程:
> ptree <- prune(tree,cp=tree$cptable[which.min(tree$cptable[,"xerror"]),"CP"])
> pData2 <- predict(ptree, testData, type="class")
修剪树的准确率仍然相同:
> sum(testData$activity==pData2)/length(pData2)
[1] 0.8094276
我想知道我修剪的树有什么问题?以及如何在 R 中使用交叉验证来修剪树模型?谢谢。