您好我正在使用以下 r 脚本来构建随机森林:
# load the necessary libraries
library(randomForest)
testPP<-numeric()
# load the dataset
QdataTrain <- read.csv('train.csv',header = FALSE)
QdataTest <- read.csv('test.csv',header = FALSE)
QdataTrainX <- subset(QdataTrain,select=-V1)
QdataTrainY<-as.factor(QdataTrain$V1)
QdataTestX <- subset(QdataTest,select=-V1)
QdataTestY<-as.factor(QdataTest$V1)
mdl <- randomForest(QdataTrainX, QdataTrainY)
我收到以下错误:
Error in randomForest.default(QdataTrainX, QdataTrainY) :
NA not permitted in predictors
但是我在我的数据中没有看到 NA 的出现。
这里是我的数据供参考:
https://docs.google.com/file/d/0B0iDswLYaZ0zUFFsT01BYlRZU0E/edit
有谁知道为什么会抛出这个错误?在此期间,我会继续寻找。提前感谢您的帮助!