17

如果类型正确,将输入数组作为可选输出参数提供给 numpy 中的 ufunc 通常是否安全?例如,我已经验证了以下工作:

>>> import numpy as np
>>> arr = np.array([1.2, 3.4, 4.5])
>>> np.floor(arr, arr)
array([ 1.,  3.,  4.])

数组类型必须与输出(对于 的浮点数numpy.floor())兼容或相同,否则会发生这种情况:

>>> arr2 = np.array([1, 3, 4], dtype = np.uint8)
>>> np.floor(arr2, arr2)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: ufunc 'floor' output (typecode 'e') could not be coerced to provided output parameter (typecode 'B') according to the casting rule ''same_kind''

因此,鉴于一个适当类型的数组,就地应用 ufunc 通常安全吗?还是floor()特例?该文档没有说清楚,以下两个与该问题有切线关系的线程也没有说清楚:

  1. Numpy修改数组到位?
  2. Numpy Ceil 和 Floor “out” 论点

编辑:

作为一阶猜测,我会假设它通常是安全的,但并不总是安全的,基于http://docs.scipy.org/doc/numpy/user/c-info.ufunc-tutorial.html上的教程。在计算期间使用输出数组作为中间结果的临时持有者似乎没有任何限制。虽然类似floor()并且ciel()可能不需要临时存储,但可能需要更复杂的功能。话虽这么说,整个现有的库可能是在考虑到这一点的情况下编写的。

4

1 回答 1

5

numpy 函数的out参数是写入结果的数组。使用的主要优点out是避免在不需要的地方分配新内存。

将函数的输出写入作为输入传递的同一数组上是否安全?没有一般的答案,这取决于函数在做什么。

两个例子

以下是 ufunc 类函数的两个示例:

In [1]: def plus_one(x, out=None):
   ...:     if out is None:
   ...:         out = np.zeros_like(x)
   ...: 
   ...:     for i in range(x.size):
   ...:         out[i] = x[i] + 1
   ...:     return out
   ...: 

In [2]: x = np.arange(5)

In [3]: x
Out[3]: array([0, 1, 2, 3, 4])

In [4]: y = plus_one(x)

In [5]: y
Out[5]: array([1, 2, 3, 4, 5])

In [6]: z = plus_one(x, x)

In [7]: z
Out[7]: array([1, 2, 3, 4, 5])

功能shift_one

In [11]: def shift_one(x, out=None):
    ...:     if out is None:
    ...:         out = np.zeros_like(x)
    ...: 
    ...:     n = x.size
    ...:     for i in range(n):
    ...:         out[(i+1) % n] = x[i]
    ...:     return out
    ...: 

In [12]: x = np.arange(5)

In [13]: x
Out[13]: array([0, 1, 2, 3, 4])

In [14]: y = shift_one(x)

In [15]: y
Out[15]: array([4, 0, 1, 2, 3])

In [16]: z = shift_one(x, x)

In [17]: z
Out[17]: array([0, 0, 0, 0, 0])

对于函数plus_one来说没有问题:当参数x和out是同一个数组时,得到了预期的结果。但是shift_one当参数 x 和 out 是同一个数组时,该函数给出了令人惊讶的结果,因为数组

讨论

对于上述形式的函数out[i] := some_operation(x[i])plus_one还有 floor、ceil、sin、cos、tan、log、conj 等函数,据我所知,使用参数 out 将结果写入输入是安全的。

对于采用 ``out[i] := some_operation(x[i], y[i]) 形式的两个输入参数的函数,例如 numpy 函数 add、multiply、subtract,它也是安全的。

对于其他功能,则视情况而定。如下图所示,矩阵乘法是不安全的:

In [18]: a = np.arange(4).reshape((2,2))

In [19]: a
Out[19]: 
array([[0, 1],
       [2, 3]])

In [20]: b = (np.arange(4) % 2).reshape((2,2))

In [21]: b
Out[21]: 
array([[0, 1],
       [0, 1]], dtype=int32)

In [22]: c = np.dot(a, b)

In [23]: c
Out[23]: 
array([[0, 1],
       [0, 5]])

In [24]: d = np.dot(a, b, out=a)

In [25]: d
Out[25]: 
array([[0, 1],
       [0, 3]])

最后一点:如果实现是多线程的,不安全函数的结果甚至可能是不确定的,因为它取决于处理数组元素的顺序。

于 2016-08-03T16:13:40.720 回答