5

我有两个看起来像的元素列表

a=[['10', 'name_1'],['50','name_2'],['40','name_3'], ..., ['80', 'name_N']]
b=[(10,40),(40,60),(60,90),(90,100)]

a包含一组数据,并b定义了一些区间,我的目标是创建一个列表,其中的c列表与b. in 中的每个列表都包含区间中c包含的 a 中的所有x元素。x[0]前任:

c=[
[['10', 'name_1']],
[['50','name_2'],['40','name_3']],
[...,['80', 'name_N']]
]
4

4 回答 4

1
c = []
for r in b:
    l = []
    rn = range(*r)
    for element in a:
        if int(element[0]) in rn:
            l.append(element)
    c.append(l)

如果您的间隔非常大,请考虑使用xrange而不是range. 实际上,如果您的时间间隔相当大,请考虑以下事项。

c = []
for r in b:
    l = []
    for element in a:
        if r[0] <= int(element[0]) < r[1]:
            l.append(element)
    c.append(l)
于 2013-06-27T20:02:13.043 回答
1

您可以在此处使用collections.defaultdictbisect模块:

由于范围是连续的,因此最好b 先将列表转换为以下内容:

[10, 40, 60, 90, 100]

这样做的好处是我们现在可以使用bisect模块来查找列表中的项目可以放入的索引。例如,50 将介于 40 和 60 之间,因此bisect.bisect_right在这种情况下将返回 2。不,我们可以使用这个 2 作为键并将列表存储为它的值。这样我们就可以根据从返回的索引对这些项目进行分组bisect.bisect_right

L_b = 2* len(b)
L_a = len(a)
L_b1 = len(b1)

整体复杂性将是:max ( L_b log L_b , L_a log L_b1 )

>>> import bisect
>>> from collections import defaultdict
>>> b=[(10,40),(40,60),(60,90),(90,100)]
>>> b1 = sorted( set(z for x in b for z in x))
>>> b1
[10, 40, 60, 90, 100]
>>> dic = defaultdict(list)
for x,y in a:
    #Now  find the index where the value from the list can fit in the 
    #b1 list, bisect uses binary search so this is an O(log n ) step.
    # use this returned index as key and append the list to that key.
    ind = bisect.bisect_right(b1,int(x))
    dic[ind].append([x,y])
...     
>>> dic.values()
[[['10', 'name_1']], [['50', 'name_2'], ['40', 'name_3']], [['80', 'name_N']]]

由于 dicts 没有任何特定的顺序,因此使用排序来获得排序的输出:

>>> [dic[k] for k in sorted(dic)]
[[['10', 'name_1']], [['50', 'name_2'], ['40', 'name_3']], [['80', 'name_N']]]
于 2013-06-27T20:09:02.510 回答
0

你可以这样做:

>>> a=[['10', 'name_1'],['50','name_2'],['40','name_3'], ['80', 'name_N']]
>>> b=[(10,40),(40,60),(60,90),(90,100)]
>>> c=[]
>>> for t in b:
...    f=list(filter(lambda l: t[0]<=int(l[0])<t[1],a))
...    if f: c.append(f)
... 
>>> c
[[['10', 'name_1']], [['50', 'name_2'], ['40', 'name_3']], [['80', 'name_N']]]
于 2013-06-27T20:30:24.267 回答
0

或者你可以这样做:

>>> a=[['10', 'name_1'],['50','name_2'],['40','name_3'], ['80', 'name_N']]
>>> b=[(10,40),(40,60),(60,90),(90,100)]
>>> filter(None, [filter(lambda l: t[0]<=int(l[0])<t[1], a) for t in b])
[[['10', 'name_1']], [['50', 'name_2'], ['40', 'name_3']], [['80', 'name_N']]]
于 2013-06-27T21:13:22.990 回答