我正在尝试使用马氏距离进行聚类。我有五个组,其中包含三个变量:
第一组:
8 1 2
9 1 1
10 3 3
第 2 组:
8 9 1
9 9 3
9 10 3
第 3 组:
1 1 1
2 1 2
第 4 组:
1 6 1
3 9 3
3 10 1
4 6 3
5 6 2
第 5 组:
7 2 3
10 5 2
我按照https://people.revoledu.com/kardi/tutorial/Similarity/MahalanobisDistance.html上提供的步骤进行操作
这是我所做的:
我计算每个组的平均值。然后我通过在他们的组中找到的平均值减去所有点值来使数据居中。
然后,我使用居中的数据矩阵计算每个组的协方差矩阵。然后我得到合并的协方差矩阵,然后得到合并的协方差矩阵及其逆矩阵的转置矩阵。
这是我卡住的地方:
在示例中,计算了两个组的平均差。但是,由于我有五组,我如何计算平均差?
此外,在找到 MD 后,我将它与什么进行比较以继续聚类过程。
我想提一下,我不是在寻找代码,而是在寻找关于如何手动使用 MD 进行聚类的实际解释。
谢谢。