我想使用 R 中的 k 均值对一些数据进行聚类,如下所示。
ADP NS CNTR PP2V EML PP1V ADDPS FB PP1D ADR ISV PP2D ADSEM SUMALL CONV
2 0 0 1 0 0 0 0 0 12 0 12 0 53 0
2 0 0 1 0 0 0 0 0 14 0 25 0 53 0
2 0 0 1 0 0 0 0 0 15 0 0 0 53 0
2 0 0 1 0 0 0 0 0 15 0 4 0 53 0
2 0 0 1 0 0 0 0 0 17 0 0 0 53 0
2 0 0 1 0 0 0 0 0 18 0 0 0 106 0
2 0 0 1 0 0 0 0 0 23 0 10 0 53 0
2 0 0 1 0 0 1 0 0 0 0 1 0 106 0
2 0 0 1 0 0 3 0 0 0 0 0 0 53 0
2 0 0 2 0 0 0 0 0 0 0 0 0 3922 0
2 0 0 2 0 0 0 0 0 0 0 1 0 530 0
2 0 0 2 0 0 0 0 0 0 0 2 0 954 0
2 0 0 2 0 0 0 0 0 0 0 3 0 477 0
2 0 0 2 0 0 0 0 0 0 0 4 0 265 0
2 0 0 2 0 0 0 0 0 0 0 5 0 742 0
2 0 0 2 0 0 0 0 0 0 0 6 0 265 0
2 0 0 2 0 0 0 0 0 0 0 7 0 265 0
“SUMALL”列是在数据中观察到特定变量组合的次数。
因此,当使用 k 表示时,我希望能够将此列用作该特定组合的“权重”,以便频繁组合变得更加重要(也使集群特征作为加权平均值给出)。
我在标准包中看不到执行此操作的简单方法cluster
,任何人都可以建议是否有一种简单的方法可以执行此操作?