假设我使用例如 k-means 将包含 1000 个实例的 5 个类的训练数据集聚类到 5 个聚类(中心)。然后我通过验证测试数据集构建了一个混淆矩阵。然后我想使用从中绘制 ROC 曲线,怎么可能做到这一点?
问问题
5323 次
1 回答
5
Roc 曲线显示了真阳性率和假阳性率之间的权衡。换句话说
ROC 图是二维图,其中 TP 率绘制在 Y 轴上,FP 率绘制在 X 轴上 ROC Graphs: Notes and Practical Considerations for Researchers
当您使用离散分类器时,该分类器仅在 ROC 空间中产生一个点。通常你需要一个产生概率的分类器。您更改分类器中的参数,以便您的 TP 和 FP 率发生变化。之后,您使用这些点来绘制 ROC 曲线。
假设您使用k-means。K-means 离散地为您提供集群成员资格。一个点属于 ClusterA 或 .. ClusterE。因此,从 k-means 输出 ROC 曲线并不简单。Lee 和 Fujita 为此描述了一种算法。你应该看看他们的论文。但是算法是这样的。
- 应用 k-means
- 使用测试数据计算 TP 和 FP。
- 将数据点的成员从一个集群更改为第二个集群。
- 再次使用测试数据计算 TP 和 FP。
如您所见,他们在 ROC 空间中获得更多点并使用这些点绘制 ROC 曲线
于 2012-03-21T13:59:43.703 回答