1

我有以下情况,我想将两个数组元素相乘,其中一个数组将数组作为元素:

>>> import numpy as np
>>> base = np.array( [100., 111.,] )
>>> c = np.array( [9., 11.] )
>>> n0 = np.zeros(len(base))
>>> nn = 3 + n0     # This is the gist of a bunch of intermediate operations
>>> grid = [np.ones(i) for i in nn]
>>> base
array([ 100.,  111.])
>>> c
array([  9.,  11.])
>>> nn
array([ 3.,  3.])
>>> grid
[array([ 1.,  1.,  1.]), array([ 1.,  1.,  1.])]

到目前为止,一切看起来都不错。grid似乎有两个元素,每个元素长三个。我觉得我应该能够乘以c

>>> a = grid * c
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: operands could not be broadcast together with shapes (2,3) (2) 

这并没有像我所希望的那样进行。这个错误是有希望的。我可以做一些换位技巧并得到我的结果:

a = (grid.T * c).T Traceback(最近一次调用最后一次):文件“”,第 1 行,在 AttributeError 中:'list' 对象没有属性 'T'

这比我预期的更失败。我以为我正在处理一个数组,但我知道我现在有一个列表。我尝试了一些老式的蛮力:

>>> grid_mod = np.array( [np.ones(3), np.ones(3) ] )
>>> grid_mod
array([[ 1.,  1.,  1.],
       [ 1.,  1.,  1.]])
>>> grid_mod * c
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: operands could not be broadcast together with shapes (2,3) (2) 

我确信这会奏效!我注意到我的最后一个元素之后有一个多余的空间,所以我删除了它:

>>> grid_mod2 = np.array( [np.ones(3), np.ones(7)] )
>>> grid_mod2
array([array([ 1.,  1.,  1.]), array([ 1.,  1.,  1.,  1.,  1.,  1.,  1.])], dtype=object)
>>> grid_mod2 * c
array([array([ 9.,  9.,  9.]),
       array([ 11.,  11.,  11.,  11.,  11.,  11.,  11.])], dtype=object)

最后一个按预期工作。

我的问题是:

  1. 我如何定义grid以便结果是数组数组而不是数组列表。
  2. 这一切到底发生了什么?为什么数组末尾的额外空间会给我一个完全不同的结果。
  3. 有没有更蟒蛇的方式来解决这个问题?
4

1 回答 1

2

这两段代码产生不同的东西,虽然空格没有影响:

>>> np.array([np.ones(3), np.ones(3)])
array([[ 1.,  1.,  1.],
       [ 1.,  1.,  1.]])

因为列表中的两个数组具有相同的维度,所以这将转换为 2 行 3 列的单个数组。

>>> np.array([np.ones(3), np.ones(7)])
array([array([ 1.,  1.,  1.]), array([ 1.,  1.,  1.,  1.,  1.,  1.,  1.])], dtype=object)

在这种情况下,数组的长度不匹配,因此 numpy 创建了一个 1D 数组,长度为两个项目,object并且每个对象都恰好是一个 numpy 数组。

当您将第一个与 相乘时c,您试图将一个 shape(2, 3)数组与一个shape 数组相乘(2,),而 numpy 不知道该怎么做。如果您将c阵列重塑为具有形状,您可以获得您想要的东西(2, 1),例如

>>> grid_mod * c[:, np.newaxis]
array([[  9.,   9.,   9.],
       [ 11.,  11.,  11.]])

当您将第二个与 相乘时c,您正在尝试将两个 shape 数组相乘(2,),因此 numpy 可以毫无问题地进行元素乘法。而且由于数组中的每个项目本身都是一个数组,因此当您尝试将其乘以标量时,numpy 也知道该怎么做。虽然这确实有效,但它比以前的方法慢得多,对于 10000 行数组来说大约是 100 倍:

c = np.random.rand(10000)
a = np.random.rand(10000, 3)
b = np.empty((10000,), dtype=object)
for j in xrange(10000):
    b[j] = a[j]

%timeit a*c[:, np.newaxis]
10000 loops, best of 3: 176 us per loop

%timeit b*c
10 loops, best of 3: 16.5 ms per loop
于 2013-10-29T16:21:34.173 回答