import csv
import numpy as np
from sklearn.cluster import SpectralClustering
reader = csv.reader(open("/Users/Desktop/user2.csv","rU"),
dialect=csv.excel_tab)
x = list(reader)
result = np.array(x).astype('float')
lena = result.reshape(182, 182)
type(lena)
# Apply spectral clustering (this step goes much faster if you have pyamg
# installed)
label = SpectralClustering(n_clusters=5,
affinity='precomputed').fit_predict(lena)
我有一个包含 182 个用户的亲和力矩阵。我想根据相似度矩阵对用户进行聚类。但结果似乎将几乎所有用户聚集到一个集群中。谁能解释一下?
对于相似度矩阵。有 182*182 个条目。6510 个条目 > 0.001 ,最大值 > 0.97。对话矩阵为0。这个相似度矩阵有问题还是光谱聚类不适合这种情况?您还有其他推荐的聚类方法吗?