我希望离散化机器学习数据集中的连续特征,特别是使用有监督的离散化。事实证明r [为此有一个包/方法] 1,太棒了!但由于我不精通 RI,因此存在一些问题,如果您能提供帮助,我将不胜感激。
我收到一个错误
类变量需要是一个因素。
我在网上看了一个例子,他们似乎没有这个问题,但我有。请注意,我不太了解语法 V2 ~ .
,除此之外V2
应该是列名。
library(caret)
library(Rcpp)
library(arulesCBA)
filename <- "wine.data"
dataset <- read.csv(filename, header=FALSE)
dataset2 <- discretizeDF.supervised(V2 ~ ., dataset, method = "mdlp")
R 报告以下错误:
.parseformula(formula, data) 中的错误:类变量必须是一个因素!
您可以在此处找到数据集 wine.data:https://pastebin.com/hvDbEtMN discretizeDF.supervised的第 一个参数是一个公式,这似乎是问题所在。
请帮忙!先感谢您。