我正在使用 R 对名为“d”的数据框进行分类,其中包含如下结构的数据:
数据有 576666 行,“classLabel”列有 3 个级别:一、二、三。
我正在使用 rpart 制作决策树:
fitTree = rpart(d$classLabel ~ d$tripduration + d$from_station_id + d$gender + d$birthday)
我想预测“classLabel”的值newdata
:
newdata = data.frame( tripduration=c(345,244,543,311),
from_station_id=c(60,28,100,56),
gender=c("Male","Female","Male","Male"),
birthday=c(1972,1955,1964,1967) )
p <- predict(fitTree, newdata)
我希望我的结果是一个由 4 行组成的矩阵,每行具有“classLabel”的三个可能值的概率newdata
。但是我在 p 中得到的结果是一个 576666 行的数据框,如下所示:
predict
运行该功能时,我还会收到以下警告:
Warning message:
'newdata' had 4 rows but variables found have 576666 rows
我哪里做错了?!