1

我有一个数据集,其中包含代表分数和特征的变量(在这两个方面都混合了定性和定量)。我想根据每个分数对特征(而不是个人观察)进行聚类。所以,我想在 score_1 的基础上形成相似的特征集群(trait_1 到 trait_15),然后对分数 2 和 3 重复。下面的数据结构示例。

我在想我可以使用 ClustOfVar 包来形成这些集群,如果我只是试图将所有变量聚集到类似的组中,我会理解的。但是,我不知道如何根据其他变量之一对它们进行聚类。

如果有人有建议,我将不胜感激。提前致谢。

Score_1 Score_2 Score_3 Trait_1 Trait_2 Trait_3 …   Trait_15

n1
n2
n3
…<br> n100000

4

1 回答 1

0

You may want to look into subspace clustering algorithms.

They usually allow overlapping clusters, so you may get out quite a number of clusters.

You cluster on the traits only, then check if the found clusters correspond to your known scores in a second phase.

于 2012-09-15T09:46:45.800 回答