我将一个数据框分为两个subsets
,trainSet
和testSet
。然后我使用树库中的树命令:
tree1<-tree(y~., data=trainSet)
然后假设我想使用 testSet 修剪树 1:
tree2<-prune.tree(tree1, newdata=testSet,best=7)
但是,我注意到 tree2 的计算是基于原始的trainSet
,而不是新的数据集(testSet
)。
我不确定如何使 prune.tree 命令在新数据集上工作以选择最佳树。