我想比较简单的逻辑回归模型,其中每个模型只考虑一组指定的特征。我想对数据的重新采样进行这些回归模型的比较。
R 包mlr
允许我在任务级别使用dropFeatures
. 代码将类似于:
full_task = makeClassifTask(id = "full task", data = my_data, target = "target")
reduced_task = dropFeatures(full_task, setdiff( getTaskFeatureNames(full_task), list_feat_keep))
然后我可以在有任务列表的情况下进行基准测试。
lrn = makeLearner("classif.logreg", predict.type = "prob")
rdesc = makeResampleDesc(method = "Bootstrap", iters = 50, stratify = TRUE)
bmr = benchmark(lrn, list(full_task, reduced_task), rdesc, measures = auc, show.info = FALSE)
如何生成只考虑一组指定特征的学习器。据我所知,过滤器或选择方法总是应用一些统计程序,但不允许直接选择特征。谢谢!