我正在尝试根据字符串值属性绘制 J48 决策树并预测目标变量(分类),我已经看到很多基于数值绘制决策树的示例,但我没有遇到过基于字符串的情况。
这是样本数据集,J48 决策树工作正常。
library(RWeka)
library(party)
MyData2 <- read.csv(file="iris.csv", header=TRUE, sep=",")
m3 <- J48(species~ ., data = MyData2)`enter code here`
if(require("party", quietly = TRUE)) plot(m3)
sepal_length sepal_width petal_length petal_width species
5.1 3.5 1.4 0.2 setosa
4.9 3 1.4 0.2 setosa
7 3.2 4.7 1.4 versicolor
6.4 3.2 4.5 1.5 versicolor
6.3 3.3 6 2.5 virginica
5.8 2.7 5.1 1.9 virginica
如果我将标题 sepal_length、sepal_width 和 sepal_color 重命名,并将值作为“白色”、“黑色”以及不同颜色组合到 setosa、versicolor 和 virginca,我如何绘制决策树并预测目标物种值。
假设我有如下数据集,
sepal_color sepal_color petal_color petal_color species
white black white black setosa
white yellow white yellow versicolor
green brown green brown virginica