在名为mixed_sets 的元组列表中,存在三个单独的集合。每个集合都包含具有相交值的元组。一组中的元组不会与另一组中的元组相交。
我想出了以下代码来整理集合。我发现当涉及到元组时,python 集的功能是有限的。如果设置交集操作可以查看每个元组索引而不是在封闭的元组对象处停止,那就太好了。
这是代码:
mixed_sets= [(1,15),(2,22),(2,23),(3,13),(3,15),
(3,17),(4,22),(4,23),(5,15),(5,17),
(6,21),(6,22),(6,23),(7,15),(8,12),
(8,15),(9,19),(9,20),(10,19),(10,20),
(11,14),(11,16),(11,18),(11,19)]
def sort_sets(a_set):
idx= 0
idx2=0
while len(mixed_sets) > idx and len(a_set) > idx2:
if a_set[idx2][0] == mixed_sets[idx][0] or a_set[idx2][1] == mixed_sets[idx][1]:
a_set.append(mixed_sets[idx])
mixed_sets.pop(idx)
idx=0
else:
idx+=1
if idx == len(mixed_sets):
idx2+=1
idx=0
a_set.pop(0) #remove first item; duplicate
print a_set, 'a returned set'
return a_set
sorted_sets=[]
for new_set in mixed_sets:
sorted_sets.append(sort_sets([new_set]))
print mixed_sets #Now empty.
OUTPUT:
[(1, 15), (3, 15), (5, 15), (7, 15), (8, 15), (3, 13), (3, 17), (5, 17), (8, 12)] a returned set
[(2, 22), (2, 23), (4, 23), (6, 23), (4, 22), (6, 22), (6, 21)] a returned set
[(9, 19), (10, 19), (10, 20), (11, 19), (9, 20), (11, 14), (11, 16), (11, 18)] a returned set
现在这看起来不像是完成这项任务的最 Pythonic 方式。此代码适用于大型元组列表(大约 2E6),我觉得如果它不必检查已排序的元组,程序会运行得更快。因此我使用 pop() 来缩小混合集列表。我发现使用 pop() 会使列表推导、for 循环或任何迭代器出现问题,因此我使用了 while 循环。
它确实有效,但是是否有一种更 Pythonic 的方式来执行此任务,它不使用 while 循环以及 idx 和 idx2 计数器?