4

在我的工作中,我使用了很多维恩图,到目前为止,我一直依赖基于网络的“文尼”。这为导出各种交集(即,仅属于该特定交集的元素)提供了很好的选择。此外,它最多可以绘制 4 个列表。

问题是,使用大型列表(4K+ 元素)和超过 3 组执行此操作是一件苦差事(复制、粘贴、保存......)。因此,我决定专注于自己生成列表并将其用于绘图。

这段冗长的介绍引出了问题的症结所在。给定 3 或 4 个部分包含相同元素的列表,我如何在 Python 中处理它们以获得各种集合(唯一的、4 共有的、仅第一个和第二个共有的,等等),如维恩图(3列出图形示例4 列出图形示例)?3 个列表看起来并不难,但 4 个列表有点复杂。

4

1 回答 1

7

假设您有 python 2.6 或更高版本:

>>> from itertools import combinations
>>>
>>> data = dict(
...   list1 = set(list("alphabet")),
...   list2 = set(list("fiddlesticks")),
...   list3 = set(list("geography")),
...   list4 = set(list("bovinespongiformencephalopathy")),
... )
>>>
>>> variations = {}
>>> for i in range(len(data)):
...   for v in combinations(data.keys(),i+1):
...     vsets = [ data[x] for x in v ]
...     variations[tuple(sorted(v))] = reduce(lambda x,y: x.intersection(y), vsets)
...
>>> for k,v in sorted(variations.items(),key=lambda x: (len(x[0]),x[0])):
...   print "%r\n\t%r" % (k,v)
...
('list1',)
        set(['a', 'b', 'e', 'h', 'l', 'p', 't'])
('list2',)
        set(['c', 'e', 'd', 'f', 'i', 'k', 'l', 's', 't'])
('list3',)
        set(['a', 'e', 'g', 'h', 'o', 'p', 'r', 'y'])
('list4',)
        set(['a', 'c', 'b', 'e', 'g', 'f', 'i', 'h', 'm', 'l', 'o', 'n', 'p', 's', 'r', 't', 'v', 'y'])
('list1', 'list2')
        set(['e', 'l', 't'])
('list1', 'list3')
        set(['a', 'h', 'e', 'p'])
('list1', 'list4')
        set(['a', 'b', 'e', 'h', 'l', 'p', 't'])
('list2', 'list3')
        set(['e'])
('list2', 'list4')
        set(['c', 'e', 'f', 'i', 'l', 's', 't'])
('list3', 'list4')
        set(['a', 'e', 'g', 'h', 'o', 'p', 'r', 'y'])
('list1', 'list2', 'list3')
        set(['e'])
('list1', 'list2', 'list4')
        set(['e', 'l', 't'])
('list1', 'list3', 'list4')
        set(['a', 'h', 'e', 'p'])
('list2', 'list3', 'list4')
        set(['e'])
('list1', 'list2', 'list3', 'list4')
        set(['e'])
于 2010-02-11T11:09:15.647 回答