r - 针对单个结果变量的聚类变量 - ClustOfVar

Question

我有一个数据集，其中包含代表分数和特征的变量（在这两个方面都混合了定性和定量）。我想根据每个分数对特征（而不是个人观察）进行聚类。所以，我想在 score_1 的基础上形成相似的特征集群（trait_1 到 trait_15），然后对分数 2 和 3 重复。下面的数据结构示例。

我在想我可以使用 ClustOfVar 包来形成这些集群，如果我只是试图将所有变量聚集到类似的组中，我会理解的。但是，我不知道如何根据其他变量之一对它们进行聚类。

如果有人有建议，我将不胜感激。提前致谢。

Score_1 Score_2 Score_3 Trait_1 Trait_2 Trait_3 …   Trait_15

n1
n2
n3
…<br> n100000

score 0 · Accepted Answer

You may want to look into subspace clustering algorithms.

They usually allow overlapping clusters, so you may get out quite a number of clusters.

You cluster on the traits only, then check if the found clusters correspond to your known scores in a second phase.

1 回答 1