我有一个包含 4 个类的分类任务,我用机器学习分类器(SVM 等)解决了这些问题。
哪些统计措施可用于 4 个类别?我肯定会使用 p 值(使用置换测试),但我需要更多。
一些有趣的衡量标准是真阳性率、真阴性率、阳性预测值、阴性预测值,在 ROC 曲线下,在 PR 曲线下……但我认为这仅适用于 2 个类别。
我有一个包含 4 个类的分类任务,我用机器学习分类器(SVM 等)解决了这些问题。
哪些统计措施可用于 4 个类别?我肯定会使用 p 值(使用置换测试),但我需要更多。
一些有趣的衡量标准是真阳性率、真阴性率、阳性预测值、阴性预测值,在 ROC 曲线下,在 PR 曲线下……但我认为这仅适用于 2 个类别。
有几个可用的指标,在以下论文中进行了描述:
索科洛娃、玛丽娜和盖伊·拉帕尔梅。“对分类任务性能度量的系统分析。” 信息处理与管理 45.4 (2009): 427-437。
请参阅第 4 页的表 3 (430) - 它包含 8 个指标的简要说明和公式;为您的任务选择最合适的