我一直在研究论文中回顾期望最大化(EM),例如:
http://pdf.aminer.org/000/221/588/fuzzy_k_means_clustering_with_crisp_regions.pdf
我有一些疑问,我还没有弄清楚。例如,如果每个数据点有很多维度,会发生什么?
例如,我有以下具有 6 个数据点和 4 个维度的数据集:
>D1 D2 D3 D4
5, 19, 72, 5
6, 18, 14, 1
7, 22, 29, 4
3, 22, 51, 1
2, 21, 89, 2
1, 12, 28, 1
这意味着为了计算期望步骤,我是否需要计算 4 个标准差(每个维度一个)?
假设k = 3,我是否还必须计算每个集群的方差(不知道是否有必要根据论文中的公式......)或者只是每个维度的方差(4个属性)?