4

我有一个由迭代过程创建的列表,由可变数量的子列表组成,所有这些子列表都具有相同数量的元素;这也是可变的。例如,在一次迭代中,我可以有 4 个子列表,每个子列表 3 个元素,如下所示:

list_1 = [[1,3,5], [7,4,9], [3,6,2], [5,4,7]]

在代码的下一次迭代中,我可以拥有:

list_2 = [[2,4,8,3,5], [2,4,9,1,3], [1,9,6,3,6]]

即,每个包含 5 个元素的 3 个子列表。

对于给定的迭代,所有子列表将始终具有相同数量的元素。

我需要一种方法来为迭代生成i一个列表list_i,其中包含位于每个子列表中相同位置的所有元素的平均值。所以在第一种情况下,list_1 我会得到:

avrg_list = [4.0, 4.25, 5.75]

在第二种情况下list_2

avrg_list = [1.67, 5.67, 7.67, 2.33, 4.67]

如何使用灵活的代码来做到这一点,该代码将根据不同数量的子列表和元素进行自我调整?

4

2 回答 2

5

你有兴趣使用 numpy 吗?

In [19]: list_1 = [[1,3,5], [7,4,9], [3,6,2], [5,4,7]]
In [22]: np.mean(list_1, 0)
Out[22]: array([ 4.  ,  4.25,  5.75])
于 2013-08-30T16:42:08.650 回答
4

zip与 一起使用*

>>> [sum(x)/float(len(x)) for x in zip(*list_1)]
[4.0, 4.25, 5.75]
>>> [sum(x)/float(len(x)) for x in zip(*list_2)]
[1.6666666666666667, 5.666666666666667, 7.666666666666667, 2.3333333333333335, 4.666666666666667]

来自文档

zip()*操作符一起可以用来解压一个列表。

>>> zip(*list_1)
[(1, 7, 3, 5), (3, 4, 6, 4), (5, 9, 2, 7)]

时间比较:

>>> from itertools import izip
>>> import numpy as np
>>> lis = list_1*1000
>>> arr = np.array(lis)
>>> %timeit np.mean(lis, 0)
10 loops, best of 3: 31.9 ms per loop
>>> %timeit np.mean(arr, 0)
1000 loops, best of 3: 221 us per loop    #clear winner
>>> %timeit [sum(x)/float(len(x)) for x in zip(*lis)]
100 loops, best of 3: 826 us per loop
#itertools.izip is memory efficient.
>>> %timeit [sum(x)/float(len(x)) for x in izip(*lis)]
100 loops, best of 3: 881 us per loop
于 2013-08-30T16:40:06.060 回答