我正在重构一个进行 kmean 聚类的 C++ 代码。代码有两个版本:
- 正常kmean
- 特征对齐聚类:使用稍微不同的距离度量和更新规则。
我应该如何有效地实施这一点?方法重载(虽然这不依赖于输入)
好的,这是进行 kmean 聚类的伪代码。我需要实现两个版本的距离和更新功能。
int* kmean_clustering(vector<double[10]> data)
// each row of data hold one data point
// so we have M data points of 10 dimension
{
// Split codebook
// Assignment step
Find the closest codebook based on distance(distance here can be Euclidean, Mahalanobis, .....)
//Update step
}