1

以下是我正在实现的一段代码:

train.data <- data.frame(cbind(all[1:end_trn,-1],Response))

#model building
train.task <- makeClassifTask(data = train.data[1:round(end_trn*train.fact),], target = "Response")
test.task <- makeClassifTask(data = train.data[(round(end_trn*train.fact)+1):end_trn,], target = "Response")

lrn = makeLearner("classif.xgboost")
lrn$par.vals = list(nrounds = 10,
        print.every.n = 5,
        objective = "multi:softmax",
        #num_class = 9,
        depth = 4,
        eta = 0.05,
        colsample_bytree = 0.66,
        min_child_weight = 4,
        subsample = 0.91)

model <- train(lrn, train.task)
pred <- predict(model, train.task)

在执行代码的最后一个命令时,我遇到以下错误:

Error in data.frame(id = 1:47505, truth = c(8L, 4L, 8L, 8L, 8L, 8L, 8L,  : 
  arguments imply differing number of rows: 47505, 5938

我为一个简单的虹膜数据案例运行了相同的脚本,它运行良好。“参数意味着不同的行数:47505、5938”是什么意思?训练集有 47505 行,5938 表示什么?*使用的库是'mlr'

提前致谢,

4

1 回答 1

0

您的某些数据可能包含 NA,并且 predict 函数不会对已学习分类器使用的 NA 值进行估算。在这种情况下,错误消息可以重新表述为:“5938 over 47505 rows are valid”。丢弃包含 NA 的第一个数据。

于 2018-12-06T14:28:43.343 回答