我在 MATLAB(内置)中使用朴素贝叶斯来预测我的数据的类标签值。我的类标签可以具有 {1,2,3,4,5} 中的任何值。我也有 testLabels。如何衡量 testLabels 和 predictLabels 的差异是否良好?
我尝试使用 RMSE。但似乎它给了我 1.87124 的价值
我不知道如何解释这个 RMSE 值?
此外,是否有任何标准的评估方法来评估朴素贝叶斯多类结果?
我知道对于二进制标签类,我可以使用 TPR、FPR、Precision、Accuracy 等。
我在 MATLAB(内置)中使用朴素贝叶斯来预测我的数据的类标签值。我的类标签可以具有 {1,2,3,4,5} 中的任何值。我也有 testLabels。如何衡量 testLabels 和 predictLabels 的差异是否良好?
我尝试使用 RMSE。但似乎它给了我 1.87124 的价值
我不知道如何解释这个 RMSE 值?
此外,是否有任何标准的评估方法来评估朴素贝叶斯多类结果?
我知道对于二进制标签类,我可以使用 TPR、FPR、Precision、Accuracy 等。
多类问题可以通过标准度量的泛化来评分:准确率显然适用于多类情况,召回率和精度可以通过单独查看每个类来概括。看二元问题会产生误导,因为双向分类任务比五向分类任务容易得多。
RMSE 不是一个合适的度量——考虑如果你像以前那样使用标签 1-5,你会得到 0.74 的 RMSE。但是,由于标签是任意的,您可以置换类标签并为相同的决策获得完全不同的 RMSE 。
您可以使用各种指标。对于许多情况,准确性(即 testLabel 与 predictLabel 相等的频率)是一个很好的指标。
您还可以查看precision 和recall,它们测量类似于I 型和II 型错误的东西。
不过,有一件事是肯定的——将 RMSE 应用于这种情况没有任何意义。例如,假设您使用字母 A、B、C、D、E 而不是数字 1、2、3、4、5 来标记数据。这是完全相同的问题(因为标签本身是无意义的),但现在 RMSE不可计算,因为它仅适用于数字。