30

我有一个像这样的numpy数组:

foo_array = [38,26,14,55,31,0,15,8,0,0,0,18,40,27,3,19,0,49,29,21,5,38,29,17,16]

我想用整个数组的中值替换所有零(其中零值不包含在中值的计算中)

到目前为止,我正在做这件事:

foo_array = [38,26,14,55,31,0,15,8,0,0,0,18,40,27,3,19,0,49,29,21,5,38,29,17,16]
foo = np.array(foo_array)
foo = np.sort(foo)
print "foo sorted:",foo
#foo sorted: [ 0  0  0  0  0  3  5  8 14 15 16 17 18 19 21 26 27 29 29 31 38 38 40 49 55]
nonzero_values = foo[0::] > 0
nz_values = foo[nonzero_values]
print "nonzero_values?:",nz_values
#nonzero_values?: [ 3  5  8 14 15 16 17 18 19 21 26 27 29 29 31 38 38 40 49 55]
size = np.size(nz_values)
middle = size / 2
print "median is:",nz_values[middle]
#median is: 26

有没有一种聪明的方法可以用 numpy 语法来实现这一点?

谢谢

4

2 回答 2

51

该解决方案利用了numpy.median

import numpy as np
foo_array = [38,26,14,55,31,0,15,8,0,0,0,18,40,27,3,19,0,49,29,21,5,38,29,17,16]
foo = np.array(foo_array)
# Compute the median of the non-zero elements
m = np.median(foo[foo > 0])
# Assign the median to the zero elements 
foo[foo == 0] = m

请注意,您的数组的中位数(没有零)是 23.5,但正如所写的那样,它坚持 23。

于 2013-06-12T01:41:25.337 回答
4
foo2 = foo[:]
foo2[foo2 == 0] = nz_values[middle]

而不是foo2,您可以foo根据需要进行更新。Numpy 的智能数组语法可以结合您编写的几行代码。例如,而不是,

nonzero_values = foo[0::] > 0
nz_values = foo[nonzero_values]

你可以做

nz_values = foo[foo > 0]

您可以在文档中找到有关“精美索引”的更多信息。

于 2013-06-12T01:28:46.080 回答