在切割具有最大边长的 MST 后,聚类节点的最佳方式是什么?我从 MST 边长切割的输出是一个 2xN 数组,其中每个元素都是一个整数。整数是描述边的节点标识符。下面给出了一个输出示例:
>>> print array[0:3]
[[ 0 1]
[ 0 2]
[ 2 17]]
我通常处理 100 到 20,000 个节点。我的 MST 代码足够快,但它被聚类/分组算法所困。这是一组循环繁重的功能,这就是减慢速度的原因。查看以下代码。关于如何加快速度的任何想法?我知道这是一种蛮力方法,因此最好使用更清洁的方法。在此先感谢您的帮助!
干杯,
伊莱
def _super_intersection(edges):
group = set(edges[0])
index = np.array([0])
k = 0
while k < 100:
k += 1
i = 0
for edge in edges[1:]:
i += 1
edge = set(edge)
if group & edge:
group = group | edge
index = np.append(index, i)
index = np.unique(np.array(index))
return group, index
def cluster(self, gmin = 5):
# A 2xN array of node IDs
edges = self.edges
group_nodes = {}
for no, edge in enumerate(edges):
try:
group, indice = _super_intersection(edges)
id_no = no
edges = np.delete(edges,indice,0)
if len(group) >= gmin:
group_nodes[id_no] = list(group)
except:
self.group_nodes = group_nodes