1

我在 Python 中有这个列表列表:

[[100,XHS,0],
[100,34B,3],
[100,42F,1],
[101,XHS,2],
[101,34B,5],
[101,42F,2],
[102,XHS,1],
[102,34B,2],
[102,42F,0],
[103,XHS,0],
[103,34B,4],
[103,42F,2]]

我想找到最有效的方法(我正在处理大量数据)使用每个列表中的最后一个元素为每个 id(第一个元素)创建一个新的列表列表。所以对于示例列表上面,我的结果是:

[[0,3,1],
[2,5,2],
[1,2,0],
[0,4,2]]

如何在 Python 中实现这一点?谢谢

4

5 回答 5

8

分解构建块的 itertools 方法 - 获取最后一个元素,分组为三个,将 3 个组转换为列表......

from operator import itemgetter
from itertools import imap, izip

last_element = imap(itemgetter(-1), a)
in_threes = izip(*[iter(last_element)] * 3)
res = map(list, in_threes)
# [[0, 3, 1], [2, 5, 2], [1, 2, 0], [0, 4, 2]]

但是,看起来您想在第一个元素上“分组”(而不是纯粹的 3 个连续项目的块),因此您可以使用defaultdict它:

from collections import defaultdict
dd = defaultdict(list)
for el in a:
    dd[el[0]].append(el[-1])

# defaultdict(<type 'list'>, {100: [0, 3, 1], 101: [2, 5, 2], 102: [1, 2, 0], 103: [0, 4, 2]})
于 2013-08-02T13:29:49.450 回答
2
new_list = []
temp_list = []
counter = 1

for x in list:
  temp_list.extend(x[-1])
  if ((counter % 3) == 0):
    new_list.append(temp_list)
    temp_list = []
  counter += 1
print new_list
于 2013-08-02T13:27:42.957 回答
2

您在这里尝试做件事:

  • 获取每个嵌套列表的最后一个元素。
  • 按每个嵌套列表的第一个元素对这些元素进行分组。

您可以使用列表推导来获取每个嵌套列表的最后一个元素:

last_elems = [sublist[-1] for sublist in outerlist]

如果整个列表按第一个元素(id)排序,那么您可以使用它itertools.groupby来执行第二部分:

from itertools import groupby
from operator import itemgetter

[[g[-1] for g in group] for id_, group in groupby(outerlist, key=itemgetter(0))]

演示:

>>> outerlist = [
...     [100,'XHS',0],
...     [100,'34B',3],
...     [100,'42F',1],
...     [101,'XHS',2],
...     [101,'34B',5],
...     [101,'42F',2],
...     [102,'XHS',1],
...     [102,'34B',2],
...     [102,'42F',0],
...     [103,'XHS',0],
...     [103,'34B',4],
...     [103,'42F',2]
... ]
>>> from itertools import groupby
>>> from operator import itemgetter
>>> [[g[-1] for g in group] for id_, group in groupby(outerlist, key=itemgetter(0))]
[[0, 3, 1], [2, 5, 2], [1, 2, 0], [0, 4, 2]]

如果它没有排序,你要么必须先排序(使用outerlist.sort(key=itemgetter)),或者,如果你不需要在其他任何地方排序版本,使用一种collections.defaultdict方法来分组:

from collections import defaultdict

grouped = defaultdict(list)
for sublist in outerlist:
    grouped[sublist[0]].append(sublist[-1])

output = grouped.values()
于 2013-08-02T13:29:29.417 回答
1

如果您不知道每个键有多少项目,并且每个键的项目在原始列表中连续出现,您可以使用groupby

>>> from itertools import groupby,izip
>>> from operator import itemgetter
>>> [map(itemgetter(-1),it) for key,it in groupby(L,itemgetter(0))]
[[0, 3, 1], [2, 5, 2], [1, 2, 0], [0, 4, 2]]

解释

每个it都是具有相同键的项目的迭代器:

>>> [list(it) for key,it in groupby(L,itemgetter(0))]
[[[100, 'XHS', 0], [100, '34B', 3], [100, '42F', 1]], [[101, 'XHS', 2], [101, '34B', 5], [101, '42F', 2]], [[102, 'XHS', 1], [102, '34B', 2], [102, '42F', 0]], [[103, 'XHS', 0], [103, '34B', 4], [103, '42F', 2]]]

map只取每个子列表中的最后一个元素:

>>> [map(itemgetter(-1),it) for key,it in groupby(L,itemgetter(0))]
[[0, 3, 1], [2, 5, 2], [1, 2, 0], [0, 4, 2]]
于 2013-08-02T13:33:23.223 回答
0
l=[[100,'XHS',0],
[100,'34B',3],
[100,'42F',1],
[100,'XHS',0],
[100,'34B',30],
[100,'42F',10],
[100,'XHS',0],
[100,'34B',300],
[100,'42F',100]]

def chunks(l, n):
    for i in xrange(0, len(l), n):
        yield l[i:i+n]

将打印:

[[0, 3, 1], [0, 30, 10], [0, 300, 100]]
于 2013-08-02T13:31:49.763 回答