我有一个包含分类(名义和有序)和数字属性的数据集。我想使用这些混合属性在我的观察中计算(不)相似度矩阵。使用 R 中 cluster 包的daisy()函数,我可以很容易地得到一个相异矩阵,如下所示:
if(!require("cluster")) { install.packages("cluster"); require("cluster") }
data(flower)
as.matrix(daisy(flower, metric = "gower"))
这使用 gower 度量来处理名义变量。是否有与daisy()
R 中的函数等效的 Python?
或者任何其他允许使用 Gower 度量或类似方法来计算具有混合(名义、数字)属性的数据集的(不)相似度矩阵的任何其他模块函数?