我需要训练一个模型,该模型将对文本数据执行多标签多类分类。
我目前正在尝试按照此链接中的说明使用 R 中的 mlr 包执行相同的操作-
1)有没有其他推荐的包?
2)否则,我被困在这个地方(如上文所述)
classify <- getTaskData(dtmDf) ## dtmDf is my dtm converted to dataframe form
“分类”为 NULL
任何帮助/指示将不胜感激。
谢谢。
更新:- 尝试创建“任务”对象。代码如下-
dtm <- DocumentTermMatrix(docs)
mat <- as.matrix(dtm)
mat <- cbind(mat,data$Label)
dtmDf <- as.data.frame(mat)
target <- unique(dtmDf[,2628]) %>% as.character() %>% sort()
classify.task = makeMultilabelTask(id = "classif", data = dtmDf, target =target)
面对以下错误 -
makeSupervisedTask("multilabel", data, target, weights, blocking) 中的错误:数据的列名不包含目标变量:10
解决了
在获得所需格式的输入数据框后,我能够对其进行训练,类似于教程链接中的酵母数据,该数据作为 makeMultilabelTask() 函数的输入