我有一个这样的数组a
:
a = [[40, 10], [50, 11]]
我需要分别计算每个维度的平均值,结果应该是这样的:
[45, 10.5]
45
是 的平均值a[*][0]
和10.5
的平均值a[*][1]
。
在不使用循环的情况下解决这个问题的最优雅的方法是什么?
我有一个这样的数组a
:
a = [[40, 10], [50, 11]]
我需要分别计算每个维度的平均值,结果应该是这样的:
[45, 10.5]
45
是 的平均值a[*][0]
和10.5
的平均值a[*][1]
。
在不使用循环的情况下解决这个问题的最优雅的方法是什么?
a.mean()
接受一个axis
论点:
In [1]: import numpy as np
In [2]: a = np.array([[40, 10], [50, 11]])
In [3]: a.mean(axis=1) # to take the mean of each row
Out[3]: array([ 25. , 30.5])
In [4]: a.mean(axis=0) # to take the mean of each col
Out[4]: array([ 45. , 10.5])
或者,作为独立功能:
In [5]: np.mean(a, axis=1)
Out[5]: array([ 25. , 30.5])
您的切片不起作用的原因是因为这是切片的语法:
In [6]: a[:,0].mean() # first column
Out[6]: 45.0
In [7]: a[:,1].mean() # second column
Out[7]: 10.5
这是一个非numpy的解决方案:
>>> a = [[40, 10], [50, 11]]
>>> [float(sum(l))/len(l) for l in zip(*a)]
[45.0, 10.5]
如果你经常这样做,NumPy就是你要走的路。
如果由于某种原因你不能使用 NumPy:
>>> map(lambda x:sum(x)/float(len(x)), zip(*a))
[45.0, 10.5]