我有一个 6x1000 的二进制数据数据集(6 个数据点,1000 个布尔维度)。
我对其进行聚类分析
[idx, ctrs] = kmeans(x, 3, 'distance', 'hamming');
我得到了三个集群。如何可视化我的结果?
我有 6 行数据,每行有 1000 个属性;其中 3 个在某种程度上应该是相似的或相似的。应用聚类将显示聚类。因为我知道集群的数量,所以我只需要找到相似的行。汉明距离告诉我们行之间的相似性,结果是正确的,有 3 个簇。
[编辑:对于任何合理的数据,kmeans 总是会找到询问的簇数]
我想利用这些知识并使其易于观察和理解,而无需编写大量解释。
Matlab 的示例不适合,因为它处理数值二维数据,而我的问题涉及 n 维分类数据。
数据集在这里http://pastebin.com/cEWJfrAR
[EDIT1:如何检查集群是否重要?]
有关更多信息,请访问以下链接: https ://chat.stackoverflow.com/rooms/32090/discussion-between-oleg-komarov-and-justcurious
如果问题不清楚,请询问您遗漏的任何内容。