1

我有数百万个混淆矩阵。我应该使用哪种数据挖掘方法来总结它们或找到这些矩阵之间的关系?如果您能给我一个对我有帮助的提示,我将不胜感激。

4

2 回答 2

0

该方法取决于您要查找的关系类型。

您的关键问题应该是如何衡量这些矩阵的相似性。

于 2014-07-01T10:55:52.880 回答
0

混淆矩阵主要用于给出分类模型性能的数值。你有数百万个,既奇怪又有趣!(如果您添加一些解释说明您最终从哪里获得了数百万个混淆矩阵,这将很有帮助!)

如果您的混淆矩阵来自此类程序,那么您可能需要将它们给出的比率(例如“准确性”、“精确度”、“特异性”、“召回”等)作为您的新功能。然后,基于这些特征,您可以直接应用另一个分类/聚类模型来实现您的最终目标,或者从一些特征选择开始(使用描述性统计,例如:Min、Max、Mean、Median、Var)或特征提取降低空间的复杂性(维度)。

于 2017-03-30T03:12:31.610 回答