我在 LingSpam 数据集上运行 SVM 分类器,并且在 WEKA 中有以下混淆矩阵:
如果我们考虑合法->正类和垃圾邮件->负类,那么 True Positives=2405 和 True Negatives=470。
但我对假阴性和假阳性感到困惑。如果您在此处阅读“混淆表”部分,则似乎 False Positives=11 和 False Negatives=7。但是,如果您阅读此处(请使用 Ctrl+F 并搜索“所有这些数字是什么意思?”),似乎 False Positives=7 和 False Negatives=11。
我很困惑 :(。请帮帮我!此外,WEKA 中的 IR_Precision 和 IR_Recall 是什么?是 legal_precision 和 legal_recall 还是 spam_precision 和 spam_recall?
注意:将合法电子邮件视为正类,将垃圾邮件视为负类。