我有两个问题要准确。首先,我想知道是否有一种简单的方法可以调整马尔可夫聚类算法,以便我可以提前指定最后我想要多少个聚类。如果没有,您会推荐哪种类似的算法?
其次应该如何处理马尔可夫世界中的重叠集群?
我有两个问题要准确。首先,我想知道是否有一种简单的方法可以调整马尔可夫聚类算法,以便我可以提前指定最后我想要多少个聚类。如果没有,您会推荐哪种类似的算法?
其次应该如何处理马尔可夫世界中的重叠集群?
1)。没有简单的方法来调整 MCL 算法(注意:它的名称是 'Markov cluster algorithm' 没有 'ing'。许多人将其表述为 'doing Markov clustering',这很好)输出指定数量的集群. 在我看来,在 99.99% 的时间里,这是一个非常理想的功能。如果我按照您的意愿进行操作,我会生成 4 或 5 个不同粒度级别的聚类(例如将 MCL 膨胀参数设置为 1.4、2.0、3.0、4.0 和 6.0,但值得多做一些根据集群大小的分布进行选择),然后将它们统一在一个层次集群中(程序'clm close'可以做到这一点)。之后,可以遍历树并尝试找到所需大小的最佳聚类。这显然需要付出巨大的努力。
2)。MCL 产生的重叠聚类极为罕见,并且始终是输入图中对称性的结果。大多数人使用的标准 MCL 实现(来自http://micans.org/mcl/)将消除重叠。我认为这不是问题。免责声明:我撰写了 MCL。