我正在试验 R 和 randomForest 包,我对 SVM 和神经网络有一些经验。我的第一个测试是尝试回归:sin(x)+gaussian noise。使用神经网络和 svm,我获得了 sin(x) 的“相对”好的近似值,因此噪声被滤除并且学习算法不会过拟合。(对于体面的参数)在 randomForest 上做同样的事情时,我有一个完全过拟合的解决方案。我只是使用(R 2.14.0,也在 2.14.1 上尝试过,以防万一):
library("randomForest")
x<-seq(-3.14,3.14,by=0.00628)
noise<-rnorm(1001)
y<-sin(x)+noise/4
mat<-matrix(c(x,y),ncol=2,dimnames=list(NULL,c("X","Y")))
plot(x,predict(randomForest(Y~.,data=mat),mat),col="green")
points(x,y)
我想 randomForest 中有一个神奇的选项可以让它正常工作,我尝试了一些,但我没有找到合适的拉杆......