matlab - 评估朴素贝叶斯多类预测的结果

Question

我在 MATLAB（内置）中使用朴素贝叶斯来预测我的数据的类标签值。我的类标签可以具有 {1,2,3,4,5} 中的任何值。我也有 testLabels。如何衡量 testLabels 和 predictLabels 的差异是否良好？

我尝试使用 RMSE。但似乎它给了我 1.87124 的价值

我不知道如何解释这个 RMSE 值？

此外，是否有任何标准的评估方法来评估朴素贝叶斯多类结果？

我知道对于二进制标签类，我可以使用 TPR、FPR、Precision、Accuracy 等。

score 1 · Accepted Answer

多类问题可以通过标准度量的泛化来评分：准确率显然适用于多类情况，召回率和精度可以通过单独查看每个类来概括。看二元问题会产生误导，因为双向分类任务比五向分类任务容易得多。

RMSE 不是一个合适的度量——考虑如果你像以前那样使用标签 1-5，你会得到 0.74 的 RMSE。但是，由于标签是任意的，您可以置换类标签并为相同的决策获得完全不同的 RMSE 。

score 0 · Accepted Answer

您可以使用各种指标。对于许多情况，准确性（即 testLabel 与 predictLabel 相等的频率）是一个很好的指标。

您还可以查看precision 和recall，它们测量类似于I 型和II 型错误的东西。

不过，有一件事是肯定的——将 RMSE 应用于这种情况没有任何意义。例如，假设您使用字母 A、B、C、D、E 而不是数字 1、2、3、4、5 来标记数据。这是完全相同的问题（因为标签本身是无意义的），但现在 RMSE不可计算，因为它仅适用于数字。

2 回答 2