2

这是我遇到问题的任务:

给定 2 个列表,将它们过滤到只有没有共同点的项目。例如。如果内部列表相同,则将它们过滤掉。如果内部列表至少有一个共同点,也将它们过滤掉。

注意:只有一层嵌套。内部列表仅由字符串组成。我有一个可行的解决方案,但它非常混乱。寻求反馈以改进:

首先,我过滤掉两个列表中的完全匹配:

l3 = filter(lambda x: x not in l2, l1)
l4 = filter(lambda x: x not in l1, l2)

我最终得到了 2 个不具有完全相同项目的列表列表。现在我想遍历内部列表,并摆脱与另一个内部列表共享项目的任何列表。

我在做:

    for i in l3:
        for j in i:
            for k in l4:
                if j in k:
                    print j, k
                    removel3.append(tuple(i))
                    removel4.append(tuple(k))
    for i in l4:
        for j in i:
            for k in l3:
                if j in k:
                    removel3.append(tuple(k))
                    removel4.append(tuple(i))
    for i in list(set(removel3)):
        l3.remove(list(i))
    for i in list(set(removel4)):
        l4.remove(list(i))

(构建要从列表中删除的单独列表,因为直接在迭代循环中删除会弄乱列表索引并跳过项目。必须有更好的方法,但我不知道。)

但是,是的。它完成了工作,但是从元组到集合再到列表再到更多元组……听起来很不合 Python。:) 很高兴看到任何反馈!

编辑:

样本输入:

l1 = [['A', 'B', 'C'], ['D', 'E'], ['F', 'G', 'H']]
l2 = [['A', 'B', 'C'], ['D', 'I'], ['K', 'L', 'M']]

经过上述所有转换,最终得到:

>>> l3
[['F', 'G', 'H']]
>>> l4
[['K', 'L', 'M']]
4

2 回答 2

4

我不确定我是否理解你,但我会试一试。

# first, get all elements from each list as a flat set.
import itertools
set1 = set(itertools.chain.from_iterable(list1))
set2 = set(itertools.chain.from_iterable(list2))

#Now, figure out which elements they have in common
common_elements = set1 & set2

#Now eliminate inner lists which have elements in the common set
new_list1 = [lst for lst in list1 if not any(x in common_elements for x in lst)]
new_list2 = [lst for lst in list2 if not any(x in common_elements for x in lst)]

请注意,我可以这样做,因为子列表包含可散列对象。

于 2013-10-10T15:35:57.300 回答
2

我认为像这样的过滤器是你想要的

filter(lambda sublist:not any(set(sublist).intersection(x) for x in list2),list1)
于 2013-10-10T15:40:55.727 回答