0

当我在 ELKI wit Kmeans Algorithm k =32 和 max iter=100 中运行从 .wav 文件生成的一些倒谱系数数据时,它会为以下对计数措施提供负值。Jaccard=-3.3627 Recall=-3.3627 Rand=-3.3627 和 F1 Measure=2.8465 我在某处搜索了这些度量的范围,它们是 (0,1)。我用其他几种算法运行了这个数据并且遇到了同样的问题。谁能解释一下?

4

1 回答 1

1

这些值在 [0;1] 的范围内,但是:

  • 仅当您有完整的标签时(可以跳过缺少的标签,但我不确定我们的实现是否能处理这种情况)
  • 聚类必须是完整的、不重叠的、清晰的分区

此外,当集群退化时(取决于您的数据和播种, k-means可能会发生这种情况)可能会出现空集群,并且这些措施的文字实施可能会再次产生不希望的结果。

你是如何标记你的数据的?

我们尽最大努力也正确处理极端情况;但我们只能诊断和修复我们观察到的并且可以重现的东西。

于 2014-06-23T08:11:38.427 回答