我试图将文本文档分类为多个类别。我下面的代码工作正常
matrix[[i]] <- create_matrix(trainingdata[[i]][,1], language="english",removeNumbers=FALSE,stemWords=FALSE,weighting=weightTf,minWordLength=3)
container[[i]] <- create_container(matrix[[i]],trainingdata[[i]][,2],trainSize=1:50,testSize=51:100) ,
models[[i]] <- train_models(container[[i]], algorithms=c("MAXENT","SVM"))
results[[i]] = classify_models(container[[i]],models[[i]])
当我尝试使用以下代码获取精度、召回率、准确度值时:
analytic[[i]] <- create_analytics(container[[i]], results[[i]])
我收到以下错误:
Error in `row.names<-.data.frame`(`*tmp*`, value = c(NA_real_, NA_real_ :
duplicate 'row.names' are not allowed
我Categories
的是text
格式。如果我将它们转换categories
为Numeric
- 上面的代码可以正常工作。
是否有解决方法来保持类别的text
格式并获得精确度、召回率、准确度值。
我的目标是获得多类分类器的精度、召回率、准确率值和混淆矩阵。是否有任何其他包可以获取多类文本分类器的上述值(一个与全部)