我正在尝试使用 mlr 包,并希望获得卡方和信息增益值。
library(mlr)
library(FSelector)
data(PimaIndiansDiabetes)
indi <- sample(1:nrow(PimaIndiansDiabetes), 0.6 * nrow(PimaIndiansDiabetes))
train <- PimaIndiansDiabetes[indi,]
trainTask <- makeClassifTask(data = train, target = "diabetes", positive = "pos")
#Feature importance
im_feat <- generateFilterValuesData(trainTask, method = c("information.gain","chi.squared"))
plotFilterValues(im_feat)
im_feat
我不确定变量information.gain
和中有两个零的后果。这是否表明我不应该使用它们来建立模型(例如随机森林)?chi.squared
triceps
pressure
当我使用
tbl <- table(train$triceps, train$diabetes)
chisq.test(tbl)
它给了我60.473
卡方。为什么不是0?chisq
和 chi-squared-method from 和有什么区别mlr
?