我有一个关于从以下链接构建混淆矩阵的问题:Ranger Predicted Class Probability of each row in a data frame
例如,如果我有以下代码(如链接中的答案所述):
library(ranger)
library(caret)
idx = sample(nrow(iris),100)
data = iris
data$Species = factor(ifelse(data$Species=="versicolor",1,0))
Train_Set = data[idx,]
Test_Set = data[-idx,]
mdl <- ranger(Species ~ ., ,data=Train_Set,importance="impurity", save.memory = TRUE, probability=TRUE)
probabilities <- as.data.frame(predict(mdl, data = Test_Set,type='response', verbose = TRUE)$predictions)
max.col(probabilities) - 1
调用
confusionMatrix(table(Test_Set$Species, max.col(probabilities)-1))
并且,使用这个
caret::confusionMatrix(table(max.col(probabilities) - 1,Test_Set$Species))
这是创建混淆矩阵的正确方法,因为灵敏度、特异性、ppv、npv 的值不同,因为 tp、tn、fp、fn 切换?
如果我要求正类为 1 而不是使用
caret::confusionMatrix(table(max.col(probabilities) - 1,Test_Set$Species), positive = '1')
所以,矩阵中的值是 tp = 13,tn = 36,fp = 0,fn = 1,对吗?
我对如何读取混淆矩阵的值感到困惑。