cluster-analysis - 来自分类或聚类结果的 ROC 曲线

Question

假设我使用例如 k-means 将包含 1000 个实例的 5 个类的训练数据集聚类到 5 个聚类（中心）。然后我通过验证测试数据集构建了一个混淆矩阵。然后我想使用从中绘制 ROC 曲线，怎么可能做到这一点？

score 5 · Accepted Answer

Roc 曲线显示了真阳性率和假阳性率之间的权衡。换句话说

ROC 图是二维图，其中 TP 率绘制在 Y 轴上，FP 率绘制在 X 轴上 ROC Graphs: Notes and Practical Considerations for Researchers

当您使用离散分类器时，该分类器仅在 ROC 空间中产生一个点。通常你需要一个产生概率的分类器。您更改分类器中的参数，以便您的 TP 和 FP 率发生变化。之后，您使用这些点来绘制 ROC 曲线。

假设您使用k-means。K-means 离散地为您提供集群成员资格。一个点属于 ClusterA 或 .. ClusterE。因此，从 k-means 输出 ROC 曲线并不简单。Lee 和 Fujita 为此描述了一种算法。你应该看看他们的论文。但是算法是这样的。

如您所见，他们在 ROC 空间中获得更多点并使用这些点绘制 ROC 曲线

1 回答 1