1

我试图让 IML 包中的 FeatureImp 函数工作,但它一直抛出错误。下面是一个来自 diamonds 数据集的示例,我在该数据集中训练了一个随机森林模型。

library(iml)
library(caret)
library(randomForest)
data(diamonds)
# create some binary classification target (without specific meaning)
diamonds$target <- as.factor(ifelse(diamonds$color %in% c("D", "E", "F"), "X", "Y"))
# drop categorical variables (to keep it simple for demonstration purposes)
diamonds <- subset(diamonds, select = -c(color, clarity, cut))
# train model
mdl_diamonds <- train(target ~ ., method = "rf", data = diamonds)
# create iml predictor
x_pred <- Predictor$new(model = mdl_diamonds, data = diamonds[, 1:7], y = diamonds$target, type = "prob")
# calculate feature importance
x_imp <- FeatureImp$new(x_pred, loss = "mae")

这以以下错误结束:

Error in if (self$original.error == 0) { :
  missing value where TRUE/FALSE needed
In addition: Warning message:
In Ops.factor(actual, predicted) : ‘-’ not meaningful for factors

我不明白我做错了什么。谁能给我线索?

我正在研究 R 版本 3.5.1,iml 包版本 0.9.0。

4

2 回答 2

1

我发现了问题。我使用“mae”作为损失函数,这是 - 我可能知道 - 不适用于分类目标。使用“ce”或“f1”按预期返回输出。

于 2019-03-19T09:11:29.917 回答
-1

因为它是随机森林。所以尝试损失='ce'。

于 2020-12-08T15:26:38.330 回答