238

我有一个 2D NumPy 数组,想用 255.0 替换其中大于或等于阈值 T 的所有值。据我所知,最基本的方法是:

shape = arr.shape
result = np.zeros(shape)
for x in range(0, shape[0]):
    for y in range(0, shape[1]):
        if arr[x, y] >= T:
            result[x, y] = 255
  1. 最简洁和最pythonic的方法是什么?

  2. 是否有更快(可能不那么简洁和/或不那么 Pythonic)的方式来做到这一点?

这将是人体头部 MRI 扫描的窗口/水平调整子程序的一部分。2D numpy 数组是图像像素数据。

4

8 回答 8

419

我认为最快和最简洁的方法是使用 NumPy 的内置 Fancy 索引。如果你有一个ndarraynamed ,你可以用一个值arr替换所有元素,如下所示:>255x

arr[arr > 255] = x

我用 500 x 500 随机矩阵在我的机器上运行这个,用 5 替换所有 >0.5 的值,平均耗时 7.59 毫秒。

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)
In [3]: timeit A[A > 0.5] = 5
100 loops, best of 3: 7.59 ms per loop
于 2013-10-29T18:46:06.187 回答
59

由于您实际上想要一个不同的数组arrwhere arr < 255255否则,这可以简单地完成:

result = np.minimum(arr, 255)

更一般地,对于下限和/或上限:

result = np.clip(arr, 0, 255)

如果您只想访问超过 255 的值或更复杂的值,@mtitan8 的答案更笼统,但np.clipand np.minimum(or np.maximum) 对于您的情况来说更好更快:

In [292]: timeit np.minimum(a, 255)
100000 loops, best of 3: 19.6 µs per loop

In [293]: %%timeit
   .....: c = np.copy(a)
   .....: c[a>255] = 255
   .....: 
10000 loops, best of 3: 86.6 µs per loop

如果您想就地进行(即修改arr而不是创建result),您可以使用以下out参数np.minimum

np.minimum(arr, 255, out=arr)

或者

np.clip(arr, 0, 255, arr)

out=名称是可选的,因为参数的顺序与函数定义的顺序相同。)

对于就地修改,布尔索引加快了很多(无需单独制作然后修改副本),但仍然不如minimum

In [328]: %%timeit
   .....: a = np.random.randint(0, 300, (100,100))
   .....: np.minimum(a, 255, a)
   .....: 
100000 loops, best of 3: 303 µs per loop

In [329]: %%timeit
   .....: a = np.random.randint(0, 300, (100,100))
   .....: a[a>255] = 255
   .....: 
100000 loops, best of 3: 356 µs per loop

为了比较,如果你想用最小值和最大值来限制你的值,没有clip你必须这样做两次,比如

np.minimum(a, 255, a)
np.maximum(a, 0, a)

或者,

a[a>255] = 255
a[a<0] = 0
于 2013-10-29T19:47:26.860 回答
18

where我认为您可以使用以下功能最快地实现这一目标:

例如,在 numpy 数组中查找大于 0.2 的项目并将其替换为 0:

import numpy as np

nums = np.random.rand(4,3)

print np.where(nums > 0.2, 0, nums)
于 2017-01-09T21:13:27.020 回答
16

另一种方法是使用np.placewhich 进行就地替换并与多维数组一起使用:

import numpy as np

# create 2x3 array with numbers 0..5
arr = np.arange(6).reshape(2, 3)

# replace 0 with -10
np.place(arr, arr == 0, -10)
于 2017-12-21T06:57:34.737 回答
13

您可以考虑使用numpy.putmask

np.putmask(arr, arr>=T, 255.0)

这是与 Numpy 的内置索引的性能比较:

In [1]: import numpy as np
In [2]: A = np.random.rand(500, 500)

In [3]: timeit np.putmask(A, A>0.5, 5)
1000 loops, best of 3: 1.34 ms per loop

In [4]: timeit A[A > 0.5] = 5
1000 loops, best of 3: 1.82 ms per loop
于 2016-05-07T10:05:26.060 回答
6

您还可以使用&, |(和/或)以获得更大的灵活性:

5 到 10 之间的值:A[(A>5)&(A<10)]

大于 10 或小于 5 的值:A[(A<5)|(A>10)]

于 2018-03-23T19:16:06.073 回答
3

让我们假设您有一个numpy包含从 0 一直到 20 的值的数组,并且您想用 0 替换大于 10 的数字

import numpy as np

my_arr = np.arange(0,21) # creates an array
my_arr[my_arr > 10] = 0 # modifies the value

但是请注意,这将修改原始数组以避免覆盖原始数组,尝试使用arr.copy()创建原始数组的新分离副本并对其进行修改。

import numpy as np

my_arr = np.arange(0,21)
my_arr_copy = my_arr.copy() # creates copy of the orignal array

my_arr_copy[my_arr_copy > 10] = 0 
于 2020-11-08T17:04:43.610 回答
0

np.where() 效果很好!

np.where(arr > 255, 255, arr)

例子:

FF = np.array([[0, 0],
              [1, 0],
              [0, 1],
              [1, 1]])
np.where(FF == 1, '+', '-')
Out[]: 
array([['-', '-'],
       ['+', '-'],
       ['-', '+'],
       ['+', '+']], dtype='<U1')
于 2022-02-01T20:09:01.180 回答