我想用 R 语言(编码)对我的数据(kmeans 或 hclust)进行聚类。我的数据是有序的,这意味着数据是李克特量表来衡量成本上升的原因(我有 41 个原因“变量”),范围从 1 到 5,其中 1 是无影响到 5 主要影响(我有大约 160观察“谁对原因进行排名”)......关于如何根据观察对 41 个原因进行聚类的任何帮助......我是否必须在聚类或任何有帮助的东西之前将比例转换为百分比或 z 分数...... .. 我真的需要你的帮助!!这是要使用的数据 https://docs.google.com/spreadsheet/ccc?key=0AlrR2eXjV8nXdGtLdlYzVk01cE96Rzg2NzRpbEZjUFE&usp=sharing
我想根据观察中出现的相似性对变量(列)进行聚类……我遵循 statmethods.net/advstats/cluster.html 中的代码;但我无法根据观察中出现的相似性对变量(列)进行聚类,并且我遵循 mattpeeples.net/kmeans.html#help 上的工作;但我不知道他为什么将数据转换为百分比,然后转换为 Z-score 标准化。