4

在大型代码库中,我np.broadcast_to用于广播数组(此处仅使用简单示例):

In [1]: x = np.array([1,2,3])

In [2]: y = np.broadcast_to(x, (2,1,3))

In [3]: y.shape
Out[3]: (2, 1, 3)

在代码的其他地方,我使用了第三方函数,这些函数可以在 Numpy 数组上以矢量化方式运行,但不是 ufunc。这些函数不理解广播,这意味着在数组上调用这样的函数y是低效的。Numpy 之类的解决方案vectorize也不好,因为虽然它们理解广播,但它们for在数组元素上引入了一个循环,这样效率非常低。

理想情况下,我想做的是有一个函数,我们可以调用 eg unbroadcast,它返回一个具有最小形状的数组,如果需要,可以广播回全尺寸。所以例如:

In [4]: z = unbroadcast(y)

In [5]: z.shape
Out[5]: (1, 1, 3)

然后我可以在 上运行第三方功能z,然后将结果广播回y.shape.

有没有办法实现unbroadcast依赖于 Numpy 的公共 API?如果没有,是否有任何黑客可以产生预期的结果?

4

2 回答 2

4

我有一个可能的解决方案,所以会在这里发布(但是如果有人有更好的解决方案,请随时回复!)。一种解决方案是检查strides数组的参数,该参数沿广播维度为 0:

def unbroadcast(array):
    slices = []
    for i in range(array.ndim):
        if array.strides[i] == 0:
            slices.append(slice(0, 1))
        else:
            slices.append(slice(None))
    return array[slices]

这给出了:

In [14]: unbroadcast(y).shape
Out[14]: (1, 1, 3)
于 2016-11-28T13:56:57.543 回答
3

这可能相当于您自己的解决方案,只是内置了一点。它as_strided用于numpy.lib.stride_tricks

import numpy as np
from numpy.lib.stride_tricks import as_strided

x = np.arange(16).reshape(2,1,8,1)  # shape (2,1,8,1)
y = np.broadcast_to(x,(2,3,8,5))    # shape (2,3,8,5) broadcast

def unbroadcast(arr):
    #determine unbroadcast shape
    newshape = np.where(np.array(arr.strides) == 0,1,arr.shape) # [2,1,8,1], thanks to @Divakar
    return as_strided(arr,shape=newshape)    # strides are automatically set here

z = unbroadcast(x)
np.all(z==x)  # is True

请注意,在我的原始答案中,我没有定义函数,结果z数组具有(64,0,8,0)as strides,而输入具有(64,64,8,8). 在当前版本中,返回的z数组与 具有相同的步幅x,我猜传递和返回数组会强制创建一个副本。无论如何,我们总是可以手动设置步幅as_strided以在所有情况下获得相同的数组,但这在上述设置中似乎没有必要。

于 2016-11-28T14:12:16.513 回答