我有大约 10K 到 100K 个节点的网络,这些节点都已连接。这些节点通常被分组为社区集群,这些社区与它们之间的许多边缘紧密相连,并且存在集线器等。在社区之间,有一些边缘将社区桥接/连接在一起的节点。这些数据集在邻接矩阵中
我已经尝试过光谱聚类(Ding et al 2001),但它在大型数据集上真的很慢,并且当存在很多歧义时似乎停止工作(桥梁不是通往另一个集群的唯一桥梁路线 - 其他社区可以充当替代代理路由)。
我尝试了一些来自martelot的方法,例如用于模块化优化的 Newman 算法,但没有将稳定性优化功能纳入这项工作(这可能很关键吗?)。在由随机图(ER 图)创建集群的合成数据集上,这些方法有效,但在存在嵌套层次结构的真实数据集上,结果分散。使用独立的可视化应用程序/工具,桥梁是显而易见的。
您会推荐/建议尝试哪些方法?我正在使用 MATLAB。