需要帮助找到一个基于开放/自由密度的聚类库,该库将距离矩阵作为输入并返回集群,其中每个元素与集群中的每个其他元素的最大“x”距离(基本上返回具有指定密度的集群) .
我检查了 DBSCAN 算法,它似乎适合我的需要。您可能不会关闭的任何干净的 DBSCAN 实现,它可以通过预先计算的距离矩阵和具有所需密度的输出集群起飞?
您的输入将非常有用。
需要帮助找到一个基于开放/自由密度的聚类库,该库将距离矩阵作为输入并返回集群,其中每个元素与集群中的每个其他元素的最大“x”距离(基本上返回具有指定密度的集群) .
我检查了 DBSCAN 算法,它似乎适合我的需要。您可能不会关闭的任何干净的 DBSCAN 实现,它可以通过预先计算的距离矩阵和具有所需密度的输出集群起飞?
您的输入将非常有用。
ELKI(位于http://elki.dbs.ifi.lmu.de/)可以加载二进制或 Ascii 格式的外部距离矩阵,然后在其上运行基于距离的聚类算法。
但是,某些算法(例如 k-means)无法工作,因为这些算法依赖于到 /mean/ 的距离,而这显然不是预先计算的。但是,例如 DBSCAN 和 OPTICS 可以很好地处理预先计算的距离。
我还没有尝试过,但我正在寻找类似的东西,并遇到了 DBSCAN 的这个 python 实现:
http://scikit-learn.org/dev/auto_examples/cluster/plot_dbscan.html#example-cluster-plot-dbscan-py
Matlab 文件交换有一个 可以直接适应预计算矩阵的实现。只需pdist1
在代码中删除对函数外部的调用即可。