0

对于我的论文作业,我需要对包含来自零售店的购买数据(+1000 维)的高维数据集进行聚类分析。因为传统的聚类算法不太适合高维(并且降维不是一个真正的选择),我想尝试专门为高维数据开发的算法(例如 ProClus)。

然而,在这里,我的问题开始了。 ProClus算法

我不知道应该为参数 d 使用什么值。谁能帮我?

4

1 回答 1

0

这只是 ProClus 的众多限制之一。

该参数是集群的平均维度。它假设您的数据中某处存在一个线性集群。这可能不适用于购买数据,但您可以尝试。对于购买等稀疏数据,我宁愿专注于频繁项集挖掘。

没有通用的聚类算法。任何聚类算法都会附带您需要试验的各种参数。

对于聚类分析,您必须以某种方式可视化或分析结果,以便能够了解该方法是否有效以及效果如何。

于 2016-03-15T09:50:11.593 回答