python - 最小生成树切割后的聚类

Question

在切割具有最大边长的 MST 后，聚类节点的最佳方式是什么？我从 MST 边长切割的输出是一个 2xN 数组，其中每个元素都是一个整数。整数是描述边的节点标识符。下面给出了一个输出示例：

>>> print array[0:3]
[[  0   1]
 [  0   2]
 [  2  17]]

我通常处理 100 到 20,000 个节点。我的 MST 代码足够快，但它被聚类/分组算法所困。这是一组循环繁重的功能，这就是减慢速度的原因。查看以下代码。关于如何加快速度的任何想法？我知道这是一种蛮力方法，因此最好使用更清洁的方法。在此先感谢您的帮助！

干杯，

伊莱

def _super_intersection(edges):
    group = set(edges[0])
    index = np.array([0])
    k = 0
    while k < 100:
        k += 1
        i = 0
        for edge in edges[1:]:
             i += 1
             edge = set(edge)
             if group & edge:
                 group = group | edge
                 index = np.append(index, i)

index = np.unique(np.array(index))
return group, index


def cluster(self, gmin = 5):
    # A 2xN array of node IDs
    edges = self.edges
    group_nodes = {}
    for no, edge in enumerate(edges):
        try:
            group, indice = _super_intersection(edges)
            id_no = no                
            edges = np.delete(edges,indice,0)
            if len(group) >= gmin:
                group_nodes[id_no] = list(group)
        except:
            self.group_nodes = group_nodes

score 0 · Accepted Answer

问题已解决。转到 NetworkX google group 链接以查看解决方案。

http://groups.google.com/group/networkx-discuss/browse_thread/thread/4ac4250d460a1b75

干杯，

伊莱

python - 最小生成树切割后的聚类

1 回答 1

Related

Reference