0

我有一些标记数据,将数据集分类为正面或负面。现在我有一个自动执行相同操作的算法,我想比较结果。

有人说我使用精确度和召回率,但我不确定这些是否合适,因为真正的否定甚至没有出现在公式中。我宁愿对正面和负面都使用一般的“预测率”。

评估算法的好方法是什么?谢谢!!

4

1 回答 1

0

没有通用的“最佳”评估方法,一切都取决于您的目标,因为每种方法都捕捉到不同的现象:

  • 准确度是一种简单的度量,非常适合多标签分类和相当平衡的数据
  • F1-score 捕捉精度/召回权衡
  • MCC 是一个很好的度量,非常适合类大小不均衡的数据集
于 2013-09-28T19:21:01.723 回答