我最近基于本文中描述的算法实现了一个词袋分类算法。
一切都很好,但我想使用 ROC 曲线或精确召回图来测量分类器的准确性。
我可以很容易地得到每个分类器的混淆矩阵,但我不知道我应该改变什么参数来获得更多的点并实际绘制曲线。
有人可以向我解释一下吗?
我最近基于本文中描述的算法实现了一个词袋分类算法。
一切都很好,但我想使用 ROC 曲线或精确召回图来测量分类器的准确性。
我可以很容易地得到每个分类器的混淆矩阵,但我不知道我应该改变什么参数来获得更多的点并实际绘制曲线。
有人可以向我解释一下吗?
我认为分类器的输出必须是连续值而不是离散值才能绘制 ROC 曲线。如果预测的标签是连续值,那么您可以设置一个阈值来计算 ROC 曲线中的点。如果预测的标签属于两类(离散值),那么您只会在 ROC 曲线中得到一个点。
http://en.wikipedia.org/wiki/Receiver_operating_characteristic