也许是一个非常模糊的问题,但挖掘 numpy 上的链接并没有帮助我。
我需要对看起来像这样的二进制数组进行以下层次聚类的相似度矩阵计算
name val1 val2 val3 val4 val5
comp1 0 0 1 0 1
comp2 1 0 0 0 0
comp3 0 0 1 0 0
comp4 1 1 0 0 0
comp5 0 0 1 0 0
我不明白 numpy 中行名的概念。我可以像这样读取文件
test = np.genfromtxt('test.b', delimiter='\t', names = True, dtype = None)
print type(test[0])
numpy.void
print test[0]
('comp1',0, 0, 1, 0, 1)
但是如何考虑行名(这个信息非常重要)?可能吗?
我想 void 不是存储二进制数组以进行进一步相似度矩阵计算的正确方法?